Устройство для генерирования декоррелированного сигнала, используя переданную фазовую информацию

Изобретение относится к области декодирования аудио. Техническим результатом является исключение случаев, когда компоненты переходных сигналов имеют отрицательные акустические воздействия на выходные сигналы. Устройство для генерирования декоррелированного сигнала содержит блок (650) приема для приема фазовой информации, блок (310; 410; 510; 610; 710; 910) отделения сигнала переходного процесса, декоррелятор (320; 420; 520; 620; 720; 920) переходного процесса, второй декоррелятор (330; 430; 530; 630; 730; 930) и блок (340; 440; 540; 640; 740; 940) объединения, блок (310; 410; 510; 610; 710; 910) отделения сигнала переходного процесса приспособлен для разделения входного сигнала на первый и второй компоненты сигнала таким образом, чтобы первый компонент сигнала содержал части сигнала переходного процесса входного сигнала и второй компонент сигнала содержал части сигнала без переходного процесса входного сигнала. Декоррелятор (320; 420; 520; 620; 720; 920) переходного процесса адаптирован для применения фазовой информации, принятой блоком (650) приема, к компоненту сигнала переходного процесса. 3 н. и 9 з.п. ф-лы, 10 ил.

 

Настоящее изобретение относится к области обработки аудио и декодирования аудио, в частности, к декодированию сигнала, содержащего переходные процессы.

Обработка и/или декодирование аудио развились многими способами. В частности, пространственные аудио приложения стали более важными. Обработка аудио сигнала часто используется для декорреляции или воспроизведения сигналов. Кроме того, декорреляция и воспроизведение сигналов используются в процессе повышающего микширования из моно в стерео, из моно/стерео в множество каналов с повышающим микшированием, искусственной реверберации звука, стерео расширения или пользовательского интерактивного микширования/воспроизведения.

Несколько систем обработки аудио сигнала используют декорреляторы. Важным примером является применение систем декорреляции в параметрических пространственных аудио декодерах, чтобы восстановить специфичные свойства декорреляции между двумя или более сигналами, которые реконструированы из одного или нескольких сигналов понижающего микширования. Применение декорреляторов значительно улучшает перцепционное качество выведенного сигнала, например, при сравнении со стерео интенсивности. В частности, использование декорреляторов обеспечивает надлежащий синтез пространственного звука с широким звуковым изображением, несколькими параллельными звуковыми объектами и/или средой. Однако декорреляторы, как также известно, вводят артефакты, такие как изменения во временной структуре сигнала, тембре и т.д.

Другими примерными применениями декорреляторов в обработке аудио являются, например, генерирование искусственной реверберации (остаточного звучания) звука, чтобы изменить стереофонический эффект или использование декорреляторов в многоканальных системах подавления эхо-сигналов, чтобы улучшить поведение конвергенции.

Обычное современное применение декоррелятора в повышающем микшировании из моно в стерео, например, примененное в параметрическом стерео (PS), иллюстрировано на Фиг. 1, где монофонический введенный сигнал М ("сухой" (исходный) сигнал) выдается в декоррелятор 110. Декоррелятор 110 декоррелирует монофонический введенный сигнал М согласно способу декорреляции, чтобы выдать декоррелированный сигнал D ("мокрый" (обработанный) сигнал) на своем выходе. Декоррелированный сигнал D вводится в микшер 120 в качестве первого введенного сигнала микшера наряду с ′′сухим′′ монофоническим сигналом М в качестве второго введенного сигнала микшера. Кроме того, блок 130 управления повышающим микшированием вводит параметры управления повышающим микшированием в микшер 120. Микшер 120 затем генерирует два выходных канала L и R (L = левый выходной стерео канал; R = правый выходной стерео канал) согласно матрице H микширования. Коэффициенты матрицы микширования могут быть фиксированными, зависеть от сигнала или управляться пользователем.

Альтернативно, матрица микширования управляется дополнительной информацией, которая передается наряду с сигналом понижающего микширования, содержащим параметрическое описание относительно того, как микшировать с повышением сигналы понижающего микширования, чтобы сформировать желаемый многоканальный выходной сигнал. Эта пространственная дополнительная информация обычно генерируется во время процесса понижающего микширования монофонического сигнала в соответственном кодере сигнала.

Этот принцип широко применяется в пространственном кодировании аудио, например, параметрическом стерео, см., например, J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, "High-Quality Parametric Spatial Audio Coding at Low Bitrates" in Proceedings of the AES 116th Convention, Berlin, Preprint 6072, май 2004.

Другая обычная современная структура параметрического стерео декодера иллюстрирована на Фиг. 2, в которой процесс декорреляции выполняется в области преобразования. Набор 210 фильтров для анализа сигнала преобразует монофонический введенный сигнал в область преобразования, например, в частотную область. Декорреляция преобразованного монофонического введенного сигнала М затем выполняется декоррелятором 220, который генерирует декоррелированный сигнал D. Как преобразованный монофонический введенный сигнал М, так и декоррелированный сигнал D вводятся в матрицу 230 микширования. Матрица 230 микширования затем генерирует два выходных сигнала L и R, учитывая параметры повышающего микширования, которые выданы блоком 240 модификации параметров, который снабжен пространственными параметрами и который соединен с блоком 250 управления параметрами. На Фиг. 2 пространственные параметры могут быть модифицированы пользователем или дополнительными инструментами, например, последующей обработкой для бинаурального воспроизведения/презентации. В этом примере параметры повышающего микширования объединены с параметрами от бинауральных фильтров, чтобы сформировать параметры ввода для матрицы повышающего микширования. Наконец, выведенные сигналы, сгенерированные матрицей 230 микширования, выдаются в набор 260 фильтров для синтеза сигнала, который определяет стерео выведенный сигнал.

Выходной сигнал L/R матрицы 230 микширования вычисляется из монофонического введенного сигнала М и декоррелированного сигнала D согласно правилу микширования, например, посредством применения следующей формулы:

В этой матрице микширования величина декоррелированного звука, поданного на выход, управляется на основе переданных параметров, например, межканальной корреляции/когерентности (ICC) и/или фиксированных или определенных пользователем параметров настройки.

Концептуально, выведенный выходной сигнал D декоррелятора заменяет остаточный сигнал, который будет идеально учитывать точное декодирование исходных сигналов L/R. Использование выходного сигнала D декоррелятора вместо остаточного сигнала в повышающем микшировании приводит к экономии скорости передачи битов, которая иначе может требоваться для передачи остаточного сигнала. Задача декоррелятора состоит в том, чтобы таким образом сгенерировать сигнал D из монофонического сигнала М, который проявляет аналогичные свойства, как остаточный сигнал, который заменен посредством D.

Соответственно, со стороны кодера выявлены два типа пространственных параметров: первая группа параметров содержит параметры корреляции/когерентности (например, параметры ICC=параметры межканальной корреляции/когерентности), представляющие когерентность или кросс-корреляцию между двумя каналами ввода, которые должны быть закодированы. Вторая группа параметров содержит параметры разности уровней (например, параметры ILD=параметры межканальной разности уровней), представляющие разность уровней между двумя каналами ввода.

Кроме того, сигнал понижающего микширования генерируется посредством понижающего микширования двух входных каналов. Кроме того, генерируется остаточный сигнал. Остаточные сигналы являются сигналами, которые могут быть использованы для восстановления исходных сигналов посредством дополнительного использования сигнала понижающего микширования и матрицы повышающего микширования. Когда, например, N сигналов микшируются с понижением в 1 сигнал, сигнал понижающего микширования обычно составляет 1 из N компонентов, которые возникают в результате отображения N введенных сигналов. Оставшиеся компоненты, возникающие в результате отображения (например, N-1 компонентов), являются остаточными сигналами и позволяют реконструировать исходные N сигналов посредством обратного отображения. Отображение может, например, быть вращением. Отображение должно проводиться таким образом, чтобы сигнал понижающего микширования максимизировался, и остаточные сигналы минимизировались, например, аналогично преобразованию главной оси. Например, энергия сигнала понижающего микширования должна быть максимизирована, а энергии остаточных сигналов должны быть минимизированы. При понижающем микшировании 2 сигналов в 1 сигнал, сигнал понижающего микширования обычно составляет один из двух компонентов, которые возникают в результате отображения 2 введенных сигналов. Оставшийся компонент, возникающий в результате отображения, является остаточным сигналом и позволяет реконструировать исходные 2 сигнала посредством обратного отображения.

В некоторых случаях остаточный сигнал может представлять ошибку, ассоциированную с представлением двух сигналов посредством их понижающего микширования и ассоциированных параметров. Например, остаточный сигнал может быть сигналом ошибки, который представляет ошибку между исходными каналами L, R и каналами L', R', возникающими в результате повышающего микширования сигнала понижающего микширования, который был сгенерирован на основании исходных каналов L и R.

Другими словами, остаточный сигнал может быть рассмотрен как сигнал во временной области или частотной области, или области частотного поддиапазона, который вместе с только сигналом понижающего микширования или с сигналом понижающего микширования и параметрической информацией допускает корректную или почти корректную реконструкцию исходного канала. Термин ′′почти корректная реконструкция′′ должен быть понят, что реконструкция с остаточным сигналом, имеющим энергию, больше чем ноль, является более близкой к исходному каналу по сравнению с реконструкцией, использующей понижающее микширование без остаточного сигнала или использующей понижающее микширование и параметрическую информацию без остаточного сигнала.

При рассмотрении окружения MPEG (MPS), структуры, аналогичные PS, которые называются блоками ′′один в два′′ (полем OTT), используются в деревьях пространственного декодирования аудио. Это может быть видно в качестве обобщения понятия "повышающего микширования из моно в стерео" для многоканальных схем пространственного кодирования/декодирования аудио. В MPS также существуют системы повышающего микширования ′′два в три′′ (блоки TTT), которые могут применять декорреляторы в зависимости от режима работы TTT. Подробности описаны в J. Herre, K. Kjorling, J. Breebaart и др., "MPEG surround - ISO/MPEG standard for efficient and compatible multi-channel audio coding" in Proceedings AES 122th, Vienna, Austria, May 2007.

Относительно направленного кодирования аудио (DirAC), DirAC относится к параметрической схеме кодирования звукового поля, которая не связана с фиксированным количеством аудио каналов вывода с фиксированными позициями громкоговорителя. DirAC применяет декорреляторы в устройстве воспроизведения DirAC, то есть, в пространственном аудио декодере, чтобы синтезировать некогерентные компоненты звуковых полей. Больше информации, касающейся направленного кодирования аудио, можно найти в Pulkki, Ville: "Spatial Sound Reproduction with Directional Audio Coding" в J. Audio Eng. Soc, том 55, №6, 2007.

Относительно современных декорреляторов в пространственных аудио декодерах, ссылка делается на "Information Technology- MPEG audio technologies - Parti: MPEG Surround", ISO/IEC 23003-1:2007 а также на J. Engdegard, H. Purnhagen, J. Roden, L.Liljeryd, "Synthetic Ambience in Parametric Stereo Coding" in Proceedings of the AES 116th Convention, Berlin, Preprint, May 2004. Решетчатые частотонезависимые структуры IIR используются в качестве декорреляторов в пространственных аудио декодерах, например, MPS, как описано в J. Herre, K. Kjorling, J. Breebaart, et al., "MPEG surround- the ISO/MPEG standard for efficient and compatible multi-channel audio coding," in Proceedings of the 122th AES Convention, Vienna, Austria, May 2007, и как описано в ISO/IEC International Standard "Information Technology- MPEG audio technologies - Parti: MPEG Surround", ISO/IEC 23003-1:2007. Другие современные декорреляторы применяют (потенциально в зависимости от частоты) задержки, чтобы декоррелировать сигналы или сворачивать введенные сигналы, например, с экспоненциальным снижением шумовых всплесков. Для краткого обзора состояния декорреляторов настоящего уровня техники для пространственных аудио систем повышающего микширования, см. "Synthetic Ambience in Parametric Stereo Coding" AES 116th Convention, Berlin, Preprint, May 2004.

Другим способом обработки сигналов является "семантическая обработка повышающего микширования". Семантическая обработка повышающего микширования является способом для разбиения сигналов на компоненты с разными семантическими свойствами (то есть, классами сигнала) и применения разных стратегий повышающего микширования к различным компонентам сигнала. Различные алгоритмы повышающего микширования могут быть оптимизированы согласно различным семантическим свойствам, чтобы улучшить общую схему обработки сигнала. Эта концепция описана в WO/2010/017967, An apparatus for determining a spatial output multichannel-channel audio signal, международная заявка на патент, PCT/EP2009/005828, 11.8.2009, 11.6.2010 (FH090802PCT).

Дополнительная схема пространственного кодирования аудио является "способом временной перестановки", как описано в Hotho, G., van de Par, S. и Breebaart, J.: "Multichannel coding of applause signals", EURASIP Journal on Advances in Signal Processing, Jan. 2008, art.. 10. DOI=http://dx.doi.org/l 0.1155/2008/. В этом документе предложена схема пространственного кодирования аудио, которая приспособлена для кодирования/декодирования подобных аплодисментам сигналов. Эта схема основана на перцепционном подобии сегментов монофонического аудио сигнала, в частности сигнала понижающего микширования пространственного аудио кодера. Монофонический аудио сигнал сегментируют на перекрывающиеся временные сегменты. Эти сегменты переставляют во времени псевдослучайным образом (взаимно независимо для n каналов вывода) в "супер"-блоке, чтобы сформировать декоррелированные выходные каналы.

Дополнительным способом пространственного аудио кодирования является "способ временной задержки и перестановки". В DE 10 2007 018032 A: 20070417, Erzeugung dekorrelierter Signale, 17.4.2007, 23.10.2008 (FH070414PDE), предложена схема, которая также приспособлена для кодирования/декодирования подобных аплодисментам сигналов для бинаурального представления. Эта схема также основана на перцепционном подобии сегментов монофонического аудио сигнала и задержках в выходных каналах относительно другого. Чтобы избежать локализации смещения в направлении к ведущему каналу, периодически меняются ведущий и отстающий канал.

В целом, стерео или многоканальные подобные аплодисментам сигналы, кодированные/декодированные в параметрических пространственных аудио кодерах, как известно, приводят к уменьшенному качеству сигнала (см., например, Hotho, G., van de Par, S. и Breebaart, J.: "Multichannel coding of applause signals", EURASIP Journal on Advances in Signal Processing, Jan. 2008, art. 10. DOI=http://dx.doi.org/10.1155/2008/531693, см. также DE 10 2007 018032 A). Подобные аплодисментам сигналы характеризуются содержанием временных плотных комбинаций переходных процессов с различных направлений. Примерами таких сигналов являются аплодисменты, звук дождя, скачущие галопом лошади и т.д. Подобные аплодисментам сигналы часто также содержат звуковые компоненты от удаленных звуковых источников, которые перцепционно вплавлены в подобное шуму, гладкое, фоновое звуковое поле.

Современные способы декорреляции, используемые в пространственных аудио декодерах, например, окружении MPEG, содержат решетчатые частотонезависимые структуры. Они действуют как искусственные генераторы отражения звука и, следовательно, хорошо подходят для генерирования гомогенных, гладких, подобных шуму, иммерсивных звуков (как оконечных частей отражения звука в помещении). Однако имеются примеры звуковых полей с негомогенной пространственно-временной структурой, которые все еще вовлекают слушателя: одним известным примером являются подобные аплодисментам звуковые поля, которые создают окружение для слушателя не только посредством гомогенных подобных шуму полей, но также и посредством довольно плотных последовательностей отдельных хлопков с различных направлений. Следовательно, негомогенный компонент звуковых полей аплодисментов может быть характеризован пространственно распределенной комбинацией переходных процессов. Очевидно, эти отличные хлопки не являются гомогенными, гладкими и подобными шуму в целом.

Из-за своего поведения, подобному отражению звука, решетчатые частотонезависимые декорреляторы не способны генерировать иммерсивное звуковое поле с характеристиками, например, аплодисментов. Вместо этого, применяясь к подобным аплодисментам сигналам, они имеют тенденцию временно подавлять переходные процессы в сигналах. Нежелательным результатом является подобное шуму иммерсивное звуковое поле без отличительной пространственно-временной структуры подобных аплодисментам звуковых полей. Дополнительно, случаи переходных процессов, такие как отдельный хлопок, могут вызвать звонящие артефакты фильтров декоррелятора.

Система согласно Hotho, G., van de Par, S. и Breebaart, J.: "Multichannel coding of applause signals", EURASIP Journal on Advances in Signal Processing, Jan. 2008, art. 10. DOI=http://dx.doi.org/10.1155/2008/531693, будет показывать заметное ухудшение выведенного звука из-за некоторого повторяющегося качества в выходном аудио сигнале. Причина состоит в том, что один и тот же сегмент входного сигнала кажется неизменным в каждом выходном канале (хотя в другой точке во времени). Кроме того, чтобы избежать увеличенной плотности аплодисментов, некоторые исходные каналы должны быть пропущены при повышающем микшировании, и, таким образом, некоторое важное слуховое событие может быть пропущено в получающемся в результате сигнале повышающего микширования. Способ применяется, только если возможно найти сегменты сигнала, которые совместно используют одни и те же перцепционные свойства, то есть: сегменты сигнала, которые звучат одинаково. Способ в целом значительно изменяет временную структуру сигналов, которые могут применяться только для очень немногих сигналов. В случае применения схемы к неподобным аплодисментам сигналам (например, из-за некорректной классификации сигналов), временная перестановка чаще всего приведет к недопустимым результатам. Временная перестановка дополнительно ограничивает применимость случаями, когда несколько сегментов сигнала могут быть микшированы вместе без артефактов, таких как эхо-сигнал или гребенчатое фильтрование. Аналогичные недостатки относятся к способу, описанному в DE 10 2007 018032 A.

Семантическая обработка повышающего микширования, описанная в WO/2010/017967, разделяет компоненты переходного процесса сигналов до применения декорреляторов. Оставшийся (свободный от переходных процессов) сигнал вводится в обычный процессор декорреляции и повышающего микширования, тогда как сигналы с переходными процессами обрабатываются по-иному: последние (например, случайным образом) распределяются различным каналам стерео или многоканального выходного сигнала посредством применения способов амплитудного панорамирования. Амплитудное панорамирование обнаруживает несколько недостатков:

Амплитудное панорамирование не обязательно производит выходной сигнал, который близок к оригиналу. Выходной сигнал может быть близок к оригиналу, только если распределение переходных процессов в исходном сигнале может быть описано законами амплитудного панорамирования. То есть: амплитудное панорамирование может просто корректно воспроизвести события панорамированной амплитуды, но не фазовые или временные различия между переходными компонентами в различных выходных каналах.

Кроме того, применение подхода амплитудного панорамирования в MPS будет требовать обхода не только декоррелятора, но также и матрицы повышающего микширования. Так как матрица повышающего микширования отражает пространственные параметры (межканальные корреляции: корреляции ICC; разности уровней канала: разности ILD), которые необходимы, чтобы синтезировать выходной сигнал повышающего микширования, который показывает корректные пространственные свойства, сама система панорамирования должна применить некоторое правило, чтобы синтезировать выходное сигналы с корректными пространственными свойствами. Общее правило для этого неизвестно. Дополнительно, эта структура добавляет сложность, так как пространственные параметры должны учитываться дважды: один раз для части сигнала без переходного процесса и второй - для амплитудно-панорамированной части сигнала с переходным процессом.

Поэтому задача настоящего изобретения состоит в обеспечении улучшенного понятия для генерирования декоррелированного сигнала. Задача настоящего изобретения решена устройством для генерирования декоррелированного сигнала по п. 1 формулы изобретения, устройством для кодирования аудио сигнала согласно п. 11 формулы изобретения способом для генерирования декоррелированного сигнала по п. 14 формулы изобретения и в соответствии с компьютерной программой по п. 15 формулы изобретения.

Устройство согласно варианту осуществления содержит блок отделения сигнала переходного процесса для разделения входного сигнала на первый компонент сигнала и на второй компонент сигнала таким образом, чтобы первый компонент сигнала содержал части сигнала переходного процесса входного сигнала, и таким образом, чтобы второй компонент сигнала содержал части сигнала без переходного процесса входного сигнала. Блок отделения сигнала переходного процесса может отделить эти различные компоненты сигнала друг от друга, чтобы обеспечить, чтобы компоненты сигнала, которые содержат переходные процессы, могли быть обработаны по-другому, чем компоненты сигнала, которые не содержат переходные процессы.

Кроме того, устройство содержит декоррелятор переходного процесса для декорреляции компонентов сигнала, содержащих переходные процессы, согласно способу декорреляции, который в частности подходит для декорреляции компонентов сигнала, содержащих переходные процессы. Кроме того, устройство содержит второй декоррелятор для декорреляции компонентов сигнала, которые не содержат переходные процессы.

Таким образом, устройство способно или обрабатывать компоненты сигнала, используя стандартный декоррелятор, или альтернативно обрабатывать компоненты сигнала, используя декоррелятор переходного процесса, в частности, подходящий для обработки компонентов сигнала переходного процесса. В варианте осуществления блок отделения сигнала переходного процесса решает, вводится ли компонент сигнала в стандартный декоррелятор, или в декоррелятор переходного процесса.

Кроме того, устройство может быть приспособлено для разделения компонента сигнала таким образом, чтобы компонент сигнала частично вводился в декоррелятор переходного процесса и частично вводился во второй декоррелятор.

Кроме того, устройство содержит блок объединения для объединения компонентов сигнала, сформированных стандартным декоррелятором и декоррелятором переходного процесса, чтобы сгенерировать декоррелированный сигнал комбинации.

В варианте осуществления устройство содержит блок приема для приема фазовой информации, причем декоррелятор переходного процесса приспособлен для применения этой фазовой информации к первому компоненту сигнала.

В варианте осуществления блок отделения сигнала переходного процесса приспособлен или для ввода рассмотренной части сигнала входного сигнала устройства в декоррелятор переходного процесса или ввода рассмотренной части сигнала во второй декоррелятор в зависимости от информации разделения сигнала переходного процесса, которая или указывает, что рассмотренная часть сигнала содержит переходный процесс, или которая указывает, что рассмотренная часть сигнала не содержит переходный процесс. Такой вариант осуществления допускает легкую обработку информации разделения сигнала переходного процесса.

В другом варианте осуществления блок отделения сигнала переходного процесса приспособлен для частичного ввода рассмотренной части сигнала входного сигнала устройства в декоррелятор переходного процесса и частичного вывода рассмотренной части сигнала во второй декоррелятор. Величина рассмотренной части сигнала, которая вводится в блок отделения сигнала переходного процесса, и величина рассмотренной части сигнала, которая вводится во второй декоррелятор, зависит от информации разделения сигнала переходного процесса. Посредством этого может быть принят во внимание уровень переходного процесса.

В дополнительном варианте осуществления блок отделения сигнала переходного процесса приспособлен для разделения входного сигнала устройства, который представлен в частотной области. Это обеспечивает зависимую от частоты обработку переходного процесса (разделение и декорреляцию). Таким образом, некоторые компоненты сигнала первого частотного диапазона могут быть обработаны согласно способу декорреляции сигнала переходного процесса, в то время как компоненты сигнала другого частотного диапазона могут быть обработаны согласно другому, например, способу обычной декорреляции. Соответственно, в варианте осуществления блок отделения сигнала переходного процесса приспособлен для разделения входного сигнала устройства на основании зависимой от частоты информации разделения сигнала переходного процесса. Однако в альтернативном варианте осуществления блок отделения сигнала переходного процесса приспособлен для разделения входного сигнала устройства на основании независимой от частоты информации разделения. Это позволяет обеспечить более эффективную обработку сигнала переходного процесса.

В другом варианте осуществления блок отделения сигнала переходного процесса может быть адаптирован для разделения входного сигнала устройства, который представлен в частотной области, таким образом, чтобы все части сигнала входного сигнала устройства в первом диапазоне частот вводились во второй декоррелятор. Поэтому соответствующее устройство приспособлено, чтобы ограничить обработку сигнала переходного процесса, чтобы сигнализировать компоненты с частотами сигнала во втором частотном диапазоне, в то время как компоненты сигнала с частотами сигнала в первом диапазоне частот не вводятся в декоррелятор переходного процесса (но вместо этого во второй декоррелятор).

В дополнительном варианте осуществления декоррелятор переходного процесса может быть приспособлен для декорреляции первого компонента сигнала посредством применения фазовой информации, представляющей разность фаз между остаточным сигналом и сигналом понижающего микширования. На стороне кодера матрица "обратного" микширования может быть использована для создания сигнала понижающего микширования и остаточного сигнала, например, из двух каналов стерео сигнала, как было объяснено выше. В то время как сигнал понижающего микширования может быть передан на декодер, остаточный сигнал может быть отклонен. Согласно варианту осуществления, разность фаз, используемая декоррелятором переходного процесса, может быть разностью фаз между остаточным сигналом и сигналом понижающего микширования. Таким образом, может быть возможно реконструировать "искусственный" остаточный сигнал посредством применения исходной фазы остаточного сигнала к сигналу при понижающем микшировании. В варианте осуществления разность фаз может относиться к некоторому частотному диапазону, то есть, может зависеть от частоты. Альтернативно, разность фаз не относится к некоторым частотным диапазонам, но может применяться как независимый от частоты широкополосный параметр.

В дополнительном варианте осуществления фазовая составляющая может быть применена к первому компоненту сигнала посредством умножения фазовой составляющей на первый компонент сигнала.

В дополнительном варианте осуществления второй декоррелятор может быть обычным декоррелятором, например, решетчатым IIR декоррелятором.

В варианте осуществления устройство содержит микшер, приспособленный для приема входных сигналов и, кроме того, адаптированный для генерирования выходных сигналов на основании входных сигналов и правила микширования. Входной сигнал устройства подается на блок отделения переходных процессов и затем декорреллируется с помощью блока отделения переходных процессов и/или второго декорреллятора, как описано выше. Блок объединения и микшер могут быть скомпонованы так, что декорреллированный сигнал комбинации подается в микшер в качестве первого входного сигнала микшера. Вторым входным сигналом микшера может быть входной сигнал устройства или сигнал, выведенный из входного сигнала устройства. Когда процесс декоррелляции уже завершен, когда декорреллированный сигнал комбинации подается в микшер, декоррелляция переходного процесса не должна быть принята во внимание микшером. Поэтому может быть использован обычный микшер.

В дополнительном варианте осуществления микшер адаптирован для приема данных параметров корреляции/когерентности, указывающие корреляцию или когерентность между двумя сигналами и адаптирован для генерирования выходных сигналов на основании упомянутых данных параметров корреляции/когерентности. В другом варианте осуществления микшер адаптирован для приема данных параметров разности уровней, указывающих разность энергий, и адаптирован для генерирования выходных сигналов на основании упомянутых данных параметров упомянутых данных параметров разности уровней. В таком варианте осуществления декорреллятор переходного процесса, второй декорреллятор и блок объединения не должны быть адаптированы для обработки таких данных параметров, так как микшер будет заботиться об обработке соответствующих данных. С другой стороны, обычный микшер с обычной обработкой параметров корреляции/когерентности и разности уровней может быть использован в таком варианте осуществления.

Варианты осуществления более подробно объяснены со ссылками на чертежи, на которых:

Фиг. 1 иллюстрирует современное состояние применения декоррелятора при повышающем микшировании из моно в стерео;

Фиг. 2 изображает дополнительное современное состояние применения декоррелятора при повышающем микшировании из моно в стерео;

Фиг. 3 иллюстрирует устройство для генерирования декоррелированного сигнала согласно варианту осуществления;

Фиг. 4 иллюстрирует устройство для декодирования сигнала согласно варианту осуществления;

Фиг. 5 является кратким обзором системы ′′один в два′′ (OTT) согласно варианту осуществления;

Фиг. 6 иллюстрирует устройство для генерирования декоррелированного сигнала, содержащего блок приема, согласно дополнительному варианту осуществления;

Фиг. 7 является кратким обзором системы ′′один в два′′ согласно другому дополнительному варианту осуществления;

Фиг. 8 иллюстрирует примерные отображения от измерений фазовой согласованности в уровень отделения сигнала переходного процесса;

Фиг. 9 является кратким обзором системы ′′один в два′′ согласно другому дополнительному варианту осуществления;

Фиг. 10 иллюстрирует устройство для кодирования аудио сигнала, имеющего множество каналов.

Фиг. 3 иллюстрирует устройство для генерирования декоррелированного сигнала согласно варианту осуществления. Устройство содержит блок 310 отделения сигнала переходного процесса, декоррелятор 320 сигнала переходного процесса, обычный декоррелятор 330 и блок 340 объединения. Подход к обработке переходного процесса из настоящего варианта осуществления имеет целью генерировать декоррелированные сигналы из подобных аплодисментам аудио сигналов, например, для применения в процессе повышающего микширования пространственных аудио декодеров.

На Фиг. 3 входной сигнал вводится в блок 310 отделения сигнала переходного процесса. Входной сигнал может быть преобразован в частотную область, например, посредством применения набора фильтров гибридного QMF. Блок 310 отделения сигнала переходного процесса может решать для каждого рассмотренного компонента сигнала входного сигнала, содержит ли он переходный процесс. Кроме того, блок 310 отделения сигнала переходного процесса может быть скомпонован, чтобы вводить рассмотренную часть сигнала или в декоррелятор 320 сигнала переходного процесса, если рассмотренная часть сигнала содержит переходный процесс (компонент s1 сигнала), или он может вводить рассмотренную часть сигнала в обычный декоррелятор 330, если рассмотренная часть сигнала не содержит переходный процесс (компонент s2 сигнала). Блок 310 отделения сигнала переходного процесса также может быть скомпонован, чтобы разбить рассмотренную часть сигнала в зависимости от наличия переходного процесса в рассмотренной части сигнала и выдать их частично в декоррелятор 320 сигнала переходного процесса и частично в обычный декоррелятор 330.

В варианте осуществления декоррелятор 320 сигнала переходного процесса декоррелирует компонент s1 сигнала согласно способу декорреляции сигнала переходного процесса, который в частности является подходящим для декорреляции компонентов сигнала переходного процесса. Например, декорреляция компонентов сигнала переходного процесса может быть выполнена посредством применения фазовой информации, например, применения фазовых составляющих. Способ декорреляции, в котором фазовые составляющие применяются к компонентам сигнала переходного процесса, объяснены ниже относительно варианта осуществления Фиг. 5. Такой способ декорреляции также может быть использован как способ декорреляции сигнала переходного процесса декоррелятора 320 сигнала переходного процесса из варианта осуществления согласно Фиг. 3.

Компонент s2 сигнала, который содержит части сигнала без переходного процесса, вводится в обычный декоррелятор 330. Обычный декоррелятор 330 может затем декоррелировать компонент s2 сигнала согласно способу обычной декорреляции, например, посредством применения решетчатых частотонезависимых структур, например, решетчатого IIR фильтра (с бесконечным импульсным откликом).

После декорреляции посредством обычного декоррелятора 330, декоррелированный компонент сигнала из обычного декоррелятора 330 вводится в блок 340 объединения. Декоррелированный компонент сигнала с переходным процессом из декоррелятора 320 сигнала переходного процесса также вводится в блок 340 объединения. Блок 340 объединения затем объединяет оба декоррелированных компонента сигнала, например, посредством суммирования обоих компонентов сигнала, чтобы получить декоррелированный сигнал комбинации.

В целом, способ декорреляции сигнала, содержащий переходные процессы согласно варианту осуществления, может осуществляться следующим образом:

На этапе разделения входной сигнал делится на два компонента: один компонент s1 содержит переходные процессы входного сигнала, другой компонент s2 содержит оставшуюся (без переходных процессов) часть входного сигнала. Компонент s2 без переходных процессов сигнала может быть обработан в системах без применения способа декорреляции декоррелятора сигнала переходного процесса из этого варианта осуществления. То есть: сигнал s2 без переходных процессов может быть введен в одну или несколько обычных структур обработки декорреляции сигнала, например, решетчатые IIR частотонезависимые структуры.

Кроме того, компонент сигнала, содержащий переходные процессы (поток s1 сигнала с переходным процессом) вводится в структуру "декоррелятора сигнала переходного процесса", которая декоррелирует поток сигнала с переходным процессом, в то же время поддерживая специальные свойства сигнала лучше, чем обычные структуры декорреляции. Декорреляция потока сигнала переходного процесса осуществляется посредством применения фазовой информации при высоком временном разрешении. Предпочтительно, фазовая информация содержит фазовые составляющие. Кроме того, предпочтительно, чтобы фазовая информация могла быть выдана посредством кодера.

Кроме того, выходные сигналы как обычного декоррелятора, так и декоррелятора сигнала переходного процесса объединяются, чтобы сформировать декоррелированный сигнал, который может быть использован в процессе повышающего микширования пространственных аудио кодеров. Элементы (h11, h12, h21, h22) матрицы микширования (Mmix) пространственного аудио декодера могут оставаться неизменными.

Фиг. 4 иллюстрирует устройство для декодирования входного сигнала устройства согласно варианту осуществления, в котором входной сигнал устройства вводится в блок 410 отделения сигнала переходного процесса. Устройство содержит блок 410 отделения сигнала переходного процесса, декоррелятор 420 сигнала переходного процесса, обычный декоррелятор 430, блок 440 объединения и микшер 450. Блок 410 отделения сигнала переходного процесса, декоррелятор 420 сигнала переходного процесса, обычный декоррелятор 430 и блок 440 объединения настоящего варианта осуществления могут быть аналогичны блоку 310 отделения сигнала переходного процесса, декоррелятору 320 сигнала переходного процесса, обычному декоррелятору 330 и блоку 340 объединения из варианта осуществления согласно Фиг. 3, соответственно. Декоррелированный сигнал комбинации, сгенерированный блоком 440 объединения, вводится в микшер 450 в качестве первого входного сигнала микшера. Кроме того, входной сигнал устройства, который вводится в блок 410 отделения сигнала переходного процесса, также вводится в микшер 450 в качестве второго входного сигнала микшера. Альтернативно, входной сигнал устройства непосредственно не вводится в микшер 450, но сигнал, полученный из входного сигнала устройства, вводится в микшер 450. Сигнал может быть получен из входного сигнала устройства, например, посредством применения обычного способа обработки сигнала к входному сигналу устройства, например, применяя фильтр. Микшер 450 из варианта осуществления согласно Фиг. 4 приспособлен для генерирования выходных сигналов на основании входных сигналов и правила микширования. Такое правило микширования может, например, умножать входные сигналы и матрицу микширования, например, посредством применения формулы

Микшер 450 может генерировать выходные каналы L, R на основе данных параметров корреляции/когерентности, например, межканальной корреляции/когерентности (ICC), и/или данных параметров разности уровней, например, межканальной разности уровней (ILD). Например, коэффициенты матрицы микширования могут зависеть от данных параметров корреляции/когерентности и/или данных параметров разности уровней. В варианте осуществления согласно Фиг. 4 микшер 450 генерирует два выходных канала L и R. Однако в альтернативных вариантах осуществления микшер может генерировать множество выходных сигналов, например 3, 4, 5 или 9 выходных сигналов, которые могут быть сигналами звукового окружения.

Фиг. 5 изображает краткий обзор системы для подхода обработки сигнала переходного процесса в системе повышающего микширования ′′1 в 2′′ (OTT) из варианта осуществления, например, пространственного аудио декодера поля ′′1 в 2′′ MPS (окружения MPEG). Параллельный путь прохождения сигнала для разделенных переходных процессов, согласно варианту осуществления, содержится в блоке обработки сигнала переходного процесса в форме U. Входной сигнал устройства DMX вводится в блок 510 отделения сигнала переходного процесса. Входной сигнал устройства может быть представлен в частотной области. Например, входной сигнал временной области может быть преобразован в частотную область посредством применения набора фильтров QMF, который используется в окружении MPEG. Блок 510 отделения сигнала переходного процесса затем может вводить компоненты входного сигнала DMX устройства в декоррелятор 520 сигнала переходного процесса и/или в решетчатый IIR декоррелятор 530. Компоненты входного сигнала устройства затем декоррелируются декоррелятором 520 сигнала переходного процесса и/или решетчатым IIR декоррелятором 530. Затем декоррелированные компоненты D1 и D2 сигнала объединяются посредством блока 540 объединения, например, посредством суммирования обоих компонентов сигнала, чтобы получить декоррелированный сигнал D комбинации. Декоррелированный сигнал комбинации вводится в микшер 552 в качестве первого входного сигнала D микшера. Кроме того, входной сигнал DMX устройства (или альтернативно: сигнал, полученный из входного сигнала DMX устройства) также вводится в микшер 552 в качестве второго входного сигнала микшера. Микшер 552 затем генерирует первый и второй "сухой" сигнал, в зависимости от входного сигнала DMX устройства. Микшер 552 также генерирует первый и второй "мокрый" сигнал в зависимости от декоррелированного сигнала D комбинации. Сигналы, сгенерированные микшероем 552, также могут быть сгенерированы на основании переданных параметров, например, данных параметров корреляции/когерентности, например, межканальной корреляции/когерентности (ICC), и/или данных параметров разности уровней, например, межканальной разности уровней (ILD). В варианте осуществления сигналы, сгенерированные микшером 552, могут быть выданы в блок 554 формирования, который формирует выданные сигналы на основании выданных временных данных формирования. В других вариантах осуществления формирование сигнала не имеет место. Сгенерированные сигналы затем выдаются в первый блок 556 суммирования или второй блок 558 суммирования, которые объединяют выданные сигналы для генерирования первого выходного сигнала L и второго выходного сигнала R, соответственно.

Принципы обработки, показанные на Фиг. 5, могут применяться в системах повышающего микширования из моно в стерео (например, стерео аудио кодеры), а также в многоканальных установках (например, окружении MPEG). В вариантах осуществления предложенная схема обработки сигнала переходного процесса может быть применена как обновление для существующих систем повышающего микширования без больших концептуальных изменений системы повышающего микширования, так как вводится только параллельный путь прохождения сигнала декоррелятора, не изменяя сам процесс повышающего микширования.

Разделение сигнала на компонент с переходным процессом и без переходного процесса управляется параметрами, которые могут быть сгенерированы в кодере и/или пространственном аудио декодере. Декоррелятор 520 сигнала переходного процесса использует фазовую информацию, например, фазовые составляющие, которые могут быть получены в кодере или в пространственном аудио декодере. Ниже описаны возможные варианты для получения параметров обработки переходного процесса (то есть: параметров разделения переходного процесса, таких как позиции переходного процесса или уровень разделения, и параметров декорреляции сигнала переходного процесса, таких как фазовая информация).

Входной сигнал может быть представлен в частотной области. Например, сигнал может быть преобразован в частотную область посредством использования набора фильтров для анализа. Набор фильтров QMF может быть применен, чтобы получить множество сигналов частотного поддиапазона из сигнала временной области.

Для наилучшего перцепционного качества, обработка сигнала переходного процесса может быть предпочтительно ограничена частотами сигналов в ограниченном частотном диапазоне. Один пример может заключаться в ограничении диапазона обработки для индексов частотного диапазона k≥8 набора фильтров гибридного QMF, который используется в MPS, аналогично ограничению частотного диапазона управляемого формирования огибающей (GES) в MPS.

В последующем описании варианты осуществления блока 510 отделения переходного процесса объяснены более подробно. Блок 510 отделения сигнала переходного процесса разбивает входной сигнал DMX на компоненты s1 и s2 с переходным процессом и без переходного процесса, соответственно. Блок 510 отделения сигнала переходного процесса может использовать информацию разделения переходного процесса, чтобы разбить входной сигнал DMX, например, параметр β[n] разделения переходного процесса. Разбиение входного сигнала DMX может быть сделано в пути (тракте) таким образом, чтобы сумма компонента, s1+s25, была равна входному сигналу:

,

где n является временным индексом дискретизированных с понижением сигналов частотного поддиапазона, и действительные значения для параметра β[n] разделения переходного процесса переменной времени находятся в диапазоне [0, 1]. β[n] может быть независимым от частоты параметром. Блок 510 отделения сигнала переходного процесса, который приспособлен для разделения входного сигнала устройства на основании независимого от частоты параметра разделения, может подавать все части сигнала частотного поддиапазона с временным индексом n или в декоррелятор 520 сигнала переходного процесса, или во второй декоррелятор в зависимости от значения β[n].

Альтернативно, β[n] может быть зависимым от частоты параметром. Блок 510 отделения сигнала переходного процесса, который приспособлен для разделения входного сигнала устройства на основании зависимой от частоты информации разделения сигнала переходного процесса, может обрабатывать части сигнала частотного поддиапазона с одним и тем же временным индексом по-разному, если их соответствующая информация разделения сигнала переходного процесса отличается.

Кроме того, зависимость от частоты, например, может быть использована для ограничения частотного диапазона обработки сигнала переходного процесса, как упомянуто в секции выше.

В варианте осуществления информация разделения сигнала переходного процесса может быть параметром, который или указывает, что рассмотренная часть сигнала входного сигнала DMX содержит переходный процесс, или который указывает, что рассмотренная часть сигнала не содержит переходный процесс. Блок 510 отделения сигнала переходного процесса подает рассмотренную часть сигнала в декоррелятор 520 сигнала переходного процесса, если информация разделения сигнала переходного процесса указывает, что рассмотренная часть сигнала содержит переходный процесс. Альтернативно, блок 510 отделения сигнала переходного процесса подает рассмотренную часть сигнала на второй декоррелятор, например, решетчатый IIR декоррелятор 530, если информация разделения сигнала переходного процесса указывает, что рассмотренная часть сигнала содержит переходный процесс.

Например, параметр β[n] разделения переходного процесса может быть использован в качестве информации разделения сигнала переходного процесса, которая может быть двоичным параметром. n является временным индексом рассмотренной части сигнала входного сигнала DMX. β[n] может быть или 1 (указывая, что рассмотренная часть сигнала должна быть подана в декоррелятор переходного процесса), или 0 (указывая, что рассмотренная часть сигнала должна быть подана во второй декоррелятор). Ограничение β[n] посредством β ∈ {0, 1} приводит к жестким решениям с переходным процессом/без переходного процесса, то есть: компоненты, которые рассматриваются как переходные процессы, полностью отделены от входного сигнала (β=1).

В другом варианте осуществления блок 510 отделения сигнала переходного процесса приспособлен для частичной подачи рассмотренной части сигнала входного сигнала устройства в декоррелятор 520 сигнала переходного процесса и частичной подачи рассмотренной части сигнала во второй декоррелятор 530. Величина рассмотренной части сигнала, которая вводится в блок 520 отделения сигнала переходного процесса, и величина части сигнала, которая вводится во второй декоррелятор 530, зависит от информации разделения сигнала переходного процесса. В варианте осуществления β[n] должен находиться в диапазоне [0, 1]. В дополнительном варианте осуществления β[n] может быть ограничен β ∈ [0, βmax], где βmax<1, приводит к частичному разделению переходных процессов, приводя к менее выраженному эффекту схемы обработки переходного процесса. Поэтому, изменение βmax позволяет постепенно изменяться между выходным сигналом обычной обработки сигнала повышающего микширования без обработки сигнала переходного процесса и обработки повышающего микширования, включающей в себя обработку сигнала переходного процесса.

В последующем описании более подробно объяснен декоррелятор 520 сигнала переходного процесса согласно варианту осуществления.

Декоррелятор 520 сигнала переходного процесса согласно варианту осуществления создает выходной сигнал, который является значительно декоррелированным со входным. Это не изменяет временную структуру отдельных хлопков/переходных процессов (нет временного размазывания, нет задержки). Вместо этого это приводит к пространственному распределению компонентов сигнала переходного процесса (после обработки сигнала повышающего микширования), которое аналогично пространственному распределению в исходном (некодированном) сигнале. Декоррелятор 520 сигнала переходного процесса может учитывать скорость передачи битов в зависимости от компромиссов качества (например, полностью случайное пространственное распределение переходного процесса с низкой скоростью передачи в битах ↔ близкое к исходному (почти прозрачному) с высокой скоростью передачи битов). Кроме того, это достигается с низкой вычислительной сложностью.

Как было объяснено выше, на стороне кодера матрица "обратного" микширования может быть использована для создания сигнала понижающего микширования и остаточного сигнала, например, из двух каналов стерео сигнала. В то время как сигнал понижающего микширования может быть передан на декодер, остаточный сигнал может быть отклонен. Согласно варианту осуществления, разность фаз между остаточным сигналом и сигналом понижающего микширования может быть определена, например, кодером и может быть использована декодером при декорреляции сигнала. Посредством этого затем может быть возможно восстановить "искусственный" остаточный сигнал посредством применения исходной фазы остаточного сигнала к сигналу понижающего микширования.

В последующем описании будет объяснен соответствующий способ декорреляции декоррелятора 520 сигнала переходного процесса согласно варианту осуществления:

Согласно способу декорреляции сигнала переходного процесса может быть использована фазовая составляющая. Декорреляция достигается посредством простого умножения потока сигнала переходного процесса на фазовые составляющие при высоком временном разрешении, например, при временном разрешении сигнала частотного поддиапазона в системах области преобразования, например, MPS:

В этом уравнении n является временным индексом дискретизированных с понижением сигналов частотного поддиапазона. Δφ идеально отражает разность фаз между сигналом понижающего микширования и остаточным сигналом. Поэтому, остаточные переходные процессы заменяются копией переходных процессов из сигналов понижающего микширования, измененных таким образом, чтобы они показывали исходную фазу.

Применение фазовой информации неотъемлемо приводит к панорамированию переходных процессов для исходной позиции в процессе повышающего микширования. В качестве иллюстративного примера рассмотрен случай ICC=0, ILD=0: Часть переходных процессов выходных сигналов затем читается как:

Для Δφ=0 это приводит к L=2c*s, R=0, тогда как Δφ=приводит к L=0, R=2c*s. Другие значения Δφ, ICC и ILD приводят к различному уровню и отношениям фаз между визуализированными переходными процессами.

Значения Δφ[n] могут быть применены как независимые от частоты широкополосные параметры или как зависимые от частоты параметры. В случае подобных аплодисментам сигналов без тональных компонентов широкополосные значения Δφ[n] могут быть преимущественными из-за сниженных требований к скорости передачи данных и согласованной обработки широкополосных переходных процессов (согласованность по частоте).

Структура обработки переходных процессов согласно Фиг. 5 скомпонована таким образом, чтобы только обычный декоррелятор 530 обходится в отношении компонентов сигнала переходного процесса, в то время как матрица микширования остается неизменной. Таким образом, пространственные параметры (ICC, ILD) также неотъемлемо учитываются для переходных сигналов, например: ICC автоматически управляет шириной воспроизведенного распределения переходных процессов.

Рассматривая аспект того, как получить фазовую информацию, в варианте осуществления, фазовая информация может быть принята из кодера.

Фиг. 6 иллюстрирует вариант осуществления устройства для генерирования декоррелированного сигнала. Устройство содержит блок 610 отделения сигнала переходного процесса, декоррелятор 620 сигнала переходного процесса, обычный декоррелятор 630, блок 640 объединения и блок 650 приема. Блок 610 отделения сигнала переходного процесса, обычный декоррелятор 630 и блок 640 объединения аналогичны блоку 310 отделения сигнала переходного процесса, обычному декоррелятору 330 и блоку 340 объединения из варианта осуществления, показанному на Фиг. 3. Однако Фиг. 6, кроме того, иллюстрирует блок 650 приема, который приспособлен для приема фазовой информации. Фазовая информация может быть передана посредством кодера (не показан). Например, кодер может вычислять разность фаз между сигналами остатка и понижающего микширования (относительная фаза остаточного сигнала относительно сигнала понижающего микширования). Разность фаз может быть вычислена для некоторых диапазонов частот или широкой полосы (например, во временной области). Кодер может подходящим образом кодировать фазовые значения однородным или неоднородным квантованием и потенциально кодированием без потерь. После этого кодер может передавать закодированные фазовые значения в систему пространственного декодирования аудио. Получение фазовой информации из кодера является преимущественным, так как исходная фазовая информация затем доступна в декодере (за исключением ошибки квантования).

Блок 650 приема подает фазовую информацию в декоррелятор 620 сигнала переходного процесса, который использует фазовую информацию, когда он декоррелирует компонент сигнала. Например, фазовая информация может быть фазовой составляющей, и декоррелятор 620 сигнала переходного процесса может умножить принятый компонент сигнала переходного процесса на фазовую составляющую.

В случае передачи фазовой информации Δφ[n] из кодера на декодер, необходимая скорость передачи данных может быть уменьшена следующим образом:

Фазовая информация Δφ[n] может быть применена только к компонентам сигнала переходного процесса в декодере. Поэтому, фазовая информация должна быть доступна только в декодере до тех пор, пока есть компоненты переходного процесса в сигнале, который должен быть декоррелирован. Таким образом, передача фазовой информации может быть ограничена кодером таким образом, чтобы только необходимая информация была передана на декодер. Это может быть сделано посредством применения обнаружения переходного процесса в кодере, как описано ниже. Фазовая информация Δφ[n] передается только для временных точек n, для которых переходные процессы были обнаружены в кодере.

Рассматривая аспект разделения переходного процесса в варианте осуществления, разделение переходного процесса может быть возбуждено посредством кодера.

Согласно варианту осуществления, информация разделения сигнала переходного процесса (также называемая "информацией переходного процесса") может быть получена из кодера. Кодер может применять способы обнаружения переходного процесса, как описано в Andreas Walther, Christian Uhle, Sascha Disch "Using Transient Suppression in Blind Multi-channel Up-mix Algorithms," in Proc. 122nd AES Convention, Vienna, Austria, May 2007, или к входным сигналам кодера, или к сигналам понижающего микширования. Информация переходного процесса затем передается на декодер и предпочтительно получается, например, при временном разрешении дискретизированных с понижением сигналов частотного поддиапазона.

Информация переходного процесса может предпочтительно содержать простое двоичное решение (с переходным процессом/без переходного процесса) для каждой выборки сигнала во времени. Эта информация также может быть предпочтительно представлена позициями переходных процессов во времени и промежутками времени переходных процессов.

Информация переходного процесса может быть закодирована без потерь (например, кодирование длин серий, энтропийное кодирование), чтобы уменьшить скорость передачи данных, которая необходима для передачи информации переходного процесса из кодера на декодер.

Информация переходного процесса может быть передана как широкополосная информация или как зависимая от частоты информация при некотором разрешении частоты. Передача информации переходного процесса в качестве широкополосных параметров уменьшает скорость передачи данных информации переходного процесса и потенциально улучшает качество аудио из-за согласованной обработки широкополосных переходных процессов.

Вместо двоичного решения (с переходным процессом/без переходного процесса), также может быть передан уровень переходных процессов, например, квантованный в двух или четырех ступенях. Уровень переходных процессов может затем управлять разделением переходных процессов в пространственном аудио декодере следующим образом: сильные переходные процессы полностью отделены от входного сигнала решетчатого IIR декоррелятора, тогда как более слабые переходные процессы только частично отделяются.

Информация переходного процесса может быть передана, только если кодер обнаруживает подобные аплодисментам сигналы, например, используя системы обнаружения аплодисментов, как описано в Christian Uhle, "Applause Sound Detection with Low Latency" in Audio Engineering Society Convention 127, New York, 2009.

Результат обнаружения подобия входного сигнала подобным аплодисментам сигналам также может быть передан при более низком временном разрешении (например, при скорости передачи обновления пространственных параметров в MPS) на декодер, чтобы управлять уровнем разделения переходных процессов. Результат обнаружения аплодисментов может быть передан как двоичный параметр (то есть, как жесткое решение) или как недвоичный параметр (то есть, как мягкое решение). Этот параметр управляет уровнем разделения в пространственном аудио декодере. Поэтому, это позволяет (жестко или постепенно) включить/выключить обработку переходного процесса в декодере. Это позволяет избежать артефактов, которые могут иметь место, например, при применении широкополосной схемы обработки переходных процессов к сигналам, которые содержат тональные компоненты.

Фиг. 7 иллюстрирует устройство для декодирования сигнала согласно варианту осуществления. Устройство содержит блок 710 отделения сигнала переходного процесса, декоррелятор 720 сигнала переходного процесса, решетчатый IIR декоррелятор 730, блок 740 объединения, микшер 752, необязательный блок 754 формирования, первый блок 756 суммирования и второй блок 758 суммирования, которые соответствуют блоку 510 отделения сигнала переходного процесса, декоррелятору 520 сигнала переходного процесса, решетчатому IIR декоррелятору 530, блоку 540 объединения, микшеру 552, необязательному блоку 554 формирования, первому блоку 556 суммирования и второму блоку 558 суммирования из варианта осуществления согласно Фиг. 5, соответственно. В варианте осуществления на Фиг. 7 кодер получает фазовую информацию и информацию позиции переходного процесса и передает эту информацию на устройство для декодирования. Никакие остаточные сигналы не передаются. Фиг. 7 иллюстрирует конфигурацию повышающего микширования ′′1 в 2′′, например, блок OTT в MPS. Это может быть применено в стерео кодеке для повышающего микширования из монофонического сигнала понижающего микширования в стерео выходной сигнал согласно варианту осуществления. В варианте осуществления на Фиг. 7 три параметра обработки переходного процесса передаются как независимые от частоты параметры из кодера на декодер, как может быть замечено на Фиг. 7.

Первый параметр обработки переходного процесса, который должен быть передан, является двоичным решением - с переходным процессом/без переходного процесса блока обнаружения переходного процесса, работающего в кодере. Он используется, чтобы управлять разделением переходных процессов в декодере. В простой схеме двоичное решение - с переходным процессом/без переходного процесса может быть передано как двоичный флаг для каждой временной выборки частотного поддиапазона без дополнительного кодирования.

Другой параметр обработки переходного процесса, который должен быть передан, является фазовым значением Δφ[n] (или фазовыми значениями), которое необходимо для декоррелятора сигнала переходного процесса. Δφ[n] передается только в течение времен n, для которых были обнаружены переходные процессы в кодере. Значения Δφ[n] передаются как индексы блока квантования с разрешением, например, 3 бита для каждой выборки.

Другим параметром обработки переходного процесса, который должен быть передан, является уровень разделения (то есть, уровень эффекта схемы обработки сигнала переходного процесса). Эта информация передается при том же временном разрешении, как пространственные параметры ILD, ICC.

Необходимая скорость передачи битов BR для передачи решений разделения переходного процесса и широкополосной фазовой информации из кодера на декодер может быть оценена для подобных MPS систем, например, как:

B R = B R t r a n s i e n t  separation flags + B R Δ φ ( f s 64 ) + σ Q f s 64 = f s 64 ( 1 + σ Q ) ,

где σ является плотностью переходного процесса (частью временных слотов (=временные выборки частотного поддиапазона), которые маркированы как переходные процессы), Q является количеством битов для каждого переданного фазового значения, и fs является частотой дискретизации. Должно быть отмечено, что (fs/64) является частотой дискретизации дискретизированных с понижением сигналов частотного поддиапазона.

Е {σ}<0,25 был измерен для набора нескольких представляющих аплодисменты элементов, где E {.} обозначает среднее значение по длительности элемента. Разумный компромисс между точностью фазовых значений и скоростью передачи битов параметра составляет Q=3. Чтобы уменьшить скорость передачи данных параметров, ICC и ILD могут быть переданы как широкополосные реплики. Передача ICC и ILD в качестве широкополосных реплик, в частности, применяется для нетональных сигналов, таких как аплодисменты.

Дополнительно, параметры для сигнализации уровня разделения передаются со скоростью передачи обновления ICC/ILD. Для длинных пространственных кадров в MPS (32 на 64 выборки) и в 4 ступени квантованных уровней разделения, это приводит к дополнительной скорости передачи битов

Параметр уровня разделения может быть получен в кодере из результатов алгоритмов анализа сигнала, которые оценивают подобие подобным аплодисментам сигналам, тональности или другим характеристикам сигнала, которые указывают потенциальные выгоды или проблемы при применении декорреляции сигнала переходного процесса этого варианта осуществления.

Переданные параметры для обработки сигнала переходного процесса могут подлежать кодированию без потерь, чтобы уменьшить избыточность, приводящую к более низкой скорости передачи битов параметра (например, кодирование длин серий информации разделения сигнала переходного процесса, энтропийное кодирование).

Ссылаясь на аспект получения фазовой информации в варианте осуществления, фазовая информация может быть получена в декодере.

В таком варианте осуществления устройство для декодирования не получает фазовую информацию из кодера, но может само определить фазовую информацию. Поэтому, нет необходимости передавать фазовую информацию, что приведет к сниженной полной скорости передачи.

В варианте осуществления фазовая информация получается в основанном на MPS декодере из данных "управляемого формирования огибающей (GES)". Это применимо, только если передаются данные GES, то есть, если признак GES активирован в кодере. Признак GES доступен, например, в системах MPS. Отношение значений огибающей GES между выходными каналами отражает позиции панорамирования для переходных процессов при высоком временном разрешении. Отношение огибающей GES (GESR) может быть отображено на фазовую информацию, необходимую для обработки сигнала переходного процесса. В GES отображение может быть выполнено согласно правилу отображения, полученному эмпирически из построения статистики распределения фаз относительно GESR для представительного набора подходящих тестовых сигналов. Определение правила отображения является этапом для конструирования системы обработки сигнала переходного процесса, не процессом времени работы, при применении системы обработки сигнала переходного процесса. Поэтому, выгодно, что нет необходимости нести дополнительные затраты передачи для фазовых данных, если данные GES необходимы для применения признака GES, так или иначе. Обратная совместимость битового потока достигается битовыми потоками/декодерами MPS. Однако фазовая информация, извлеченная из данных GES, не является настолько точной (например: знак предполагаемой фазы неизвестен), как фазовая информация, которая может быть получена в кодере.

В дополнительном варианте осуществления фазовая информация может также быть получена в декодере, но из переданных остаточных сигналов неполного частотного диапазона. Это применимо, например, если ограниченные остаточные сигналы частотного диапазона передаются (обычно охватывая частотный диапазон до некоторой частоты перехода) в схеме кодирования MPS. В таком варианте осуществления вычисляется фазовое отношение между сигналом понижающего микширования и переданным остаточным сигналом в остаточном частотном диапазоне(ах), то есть для частот, для которых передаются остаточные сигналы. Кроме того, фазовая информация от остаточного частотного диапазона(ов) до неостаточного частотного диапазона(ов) экстраполируется (и/или возможно интерполируется). Одна возможность заключается в отображении фазового отношения, полученного в остаточном частотном диапазоне(ах), в независимое от глобальной частоты значение фазового отношения, которое затем используется для декоррелятора сигнала переходного процесса. Это приводит к выгоде, что никакие дополнительные затраты передачи не возникают для данных фаз, если передаются остаточные сигналы неполного частотного диапазона, так или иначе. Однако должно быть рассмотрено, что корректность оценки фаз зависит от ширины диапазона(ов) частот, где передаются остаточные сигналы. Корректность оценок фаз также зависит от согласованности фазового отношения между сигналом понижающего микширования и остаточным сигналом вдоль оси частоты. Для четких переходных сигналов обычно сталкиваются с высокой согласованностью.

В дополнительном варианте осуществления фазовая информация получается в декодере, используя дополнительную информацию коррекции, переданную из кодера. Такой вариант осуществления аналогичен двум предыдущим вариантам осуществления (фаза из GES, фаза из остаточных сигналов), но дополнительно, необходимо генерировать данные коррекции в кодере, которые передаются на декодер. Данные коррекции учитывают уменьшение ошибки оценки фаз, которая может иметь место в этих двух вариантах, описанных выше (фаза из GES, фаза из остаточных сигналов). Кроме того, данные коррекции могут быть получены из оценивания ошибки оценки фаз стороны декодера в кодере. Данные коррекции могут быть этой (потенциально закодированной) оцененной ошибкой оценки. Кроме того, относительно подхода оценки фаз из данных GES, данные коррекции могут просто быть правильным знаком генерируемых кодером фазовых значений. Это позволяет генерировать фазовые составляющие с правильным знаком в декодере. Выгода такого подхода заключается в том, что из-за данных коррекции, точность фазовой информации, восстанавливаемой в декодере, намного ближе к таковой, генерируемой кодером фазовой информации. Однако энтропия информации коррекции ниже, чем энтропия самой корректной фазовой информации. Таким образом, скорость передачи битов параметра снижена по сравнению с прямой передачей фазовой информации, полученной в кодере.

В другом варианте осуществления фазовая информация/фазовая составляющая получается из (псевдо-) случайного процесса в декодере. Выгода такого подхода заключается в том, что нет необходимости передавать любую фазовую информацию с высоким временным разрешением. Это приводит к уменьшенной скорости передачи данных. В варианте осуществления простой способ должен генерировать фазовые значения с однородным случайным распределением в диапазоне [-180°, 180°].

В дополнительном варианте осуществления измеряют статистические свойства распределения фаз в кодере. Эти свойства кодируют и затем передают (при низком временном разрешении) на декодер. Случайные фазовые значения генерируются в декодере, которые подпадают под переданные статистические свойства. Эти свойства могут быть средним значением, вариантами или другими статистическими измерениями статистического распределения фаз.

Когда более чем один экземпляр декоррелятора работает параллельно (например, для многоканального повышающего микширования), учитывается, что нужно гарантировать взаимно декоррелированные выходные сигналы декоррелятора. В варианте осуществления, в котором множественные векторы (псевдо-) случайных фазовых значений (вместо единственного вектора) генерируются для всех, кроме первого экземпляра декоррелятора, выбирается набор векторов, который приводит к наименьшей корреляции фазового значения по всем экземпляров декоррелятора.

В случае передачи информации коррекции фаз из кодера на декодер необходимая скорость передачи данных может быть уменьшена следующим образом.

Информация коррекции фаз должна быть доступна только в декодере до тех пор, пока есть компоненты переходного процесса в сигнале, который должен быть декоррелирован. Таким образом, передача информации коррекции фаз может быть ограничена кодером таким образом, чтобы только необходимая информация передавалась на декодер. Это может быть сделано посредством применения обнаружения переходного процесса в кодере, как было описано выше. Информация коррекции фаз передается только для временных точек n, для которых переходные процессы были обнаружены в кодере.

Ссылаясь на аспект разделения переходных процессов в варианте осуществления, разделение переходного процесса может быть возбуждено посредством декодера.

В таком варианте осуществления разделения переходного процесса может быть также получена в декодере, например, посредством применения способа обнаружения переходного процесса, как описано в Andreas Walther, Christian Uhle, Sascha Disch "Using Transient Suppression in Blind Multi-channel Up-mix Algorithms" in Proc. 122nd AES Convention, Vienna, Austria, May 2007, к сигналу понижающего микширования, который доступен в пространственном аудио декодере, до повышающего микширования в стерео или многоканальный выходной сигнал. В этом случае, информация переходного процесса не должна быть передана, что экономит скорость передачи данных передачи.

Однако выполнение обнаружения переходного процесса в декодировании может вызывать проблемы, например, при стандартизации схемы обработки сигнала переходного процесса: например, может быть трудно найти алгоритм обнаружения переходного процесса, который приводит к одинаковым результатам обнаружения переходного процесса при реализации на различных архитектурах/платформах, включающих различную числовую точность, схемы округления и т.д. Такое прогнозируемое поведение декодера часто является обязательным для стандартизации. Кроме того, стандартизированный алгоритм обнаружения переходного процесса может давать сбой для некоторых входных сигналов, вызывая недопустимые искажения в выходных сигналах. После этого может быть трудно скорректировать давший сбой алгоритм после стандартизации, не компонуя декодер, который не соответствует стандарту. Эта проблема может быть менее серьезной, если по меньшей мере один параметр, управляющий уровнем разделения переходного процесса, передается при низком временном разрешении (например, с скоростью передачи обновления пространственного параметра MPS) из кодера на декодер.

В дополнительном варианте осуществления разделение переходного процесса также возбуждается посредством декодера, и передаются остаточные сигналы неполного частотного диапазона. В этом варианте осуществления возбуждаемое декодером разделение переходного процесса может быть усовершенствовано, используя полученные оценки фаз из переданных остаточных сигналов неполного частотного диапазона (см. выше). Должно быть отмечено, что это усовершенствование может быть применено в декодере, не передавая дополнительные данные от кодера на декодер.

В этом варианте осуществления фазовые составляющие, которые применяются в декорреляторе переходного процесса, получены посредством экстраполирования корректных фазовых значений из остаточных частотных диапазонов до частот, где никакие остаточные сигналы не являются доступными. Один способ заключается в вычислении (потенциально, например, взвешенной мощности сигнала) среднего фазового значения из фазовых значений, которые могут быть вычислены для этих частот, где остаточные сигналы являются доступными. Среднее фазовое значение затем может быть применено как независимый от частоты параметр в декорреляторе переходного процесса.

До тех пор, пока корректное фазовое отношение между понижающим микшированием и остатком не зависит от частоты, среднее фазовое значение представляет хорошую оценку корректного фазового значения. Однако в случае фазового отношения, которое не является согласованным вдоль оси частоты, среднее фазовое значение может быть менее корректной оценкой, потенциально приводя к некорректным фазовым значениям и слышимым артефактам.

Согласованность фазового отношения между сигналом понижающего микширования и переданным остаточным сигналом вдоль оси частоты, поэтому, может быть использовано как измерение надежности экстраполируемой оценки фаз, которое применяется в декорреляторе переходного процесса. Чтобы снизить риск слышимых артефактов, измерение согласованности, полученное в декодере, может быть использовано для управления уровнем разделения переходных процессов в декодере, например, следующим образом.

Переходные процессы, для которых соответствующая фазовая информация (то есть фазовая информация для одного и того же временного индекса n) является согласованной вдоль частоты, полностью отделены от обычного входного сигнала декоррелятора и полностью вводятся в декоррелятор переходного процесса. Так как большие ошибки оценки фаз маловероятны, используется весь потенциал обработки сигнала переходного процесса.

Переходные процессы, для которых соответствующая фазовая информация является менее согласованной вдоль частоты, только частично отделяются, приводя к менее заметному эффекту схемы обработки сигнала переходного процесса.

Переходные процессы, для которых соответствующая фазовая информация является очень несогласованной вдоль частоты, не отделяются, приводя к стандартному поведению обычной системы повышающего микширования без предложенной обработки сигнала переходного процесса. Таким образом, не могут иметь место артефакты из-за больших ошибок оценки фаз.

Измерения согласованности для фазовой информации могут быть выведены, например, из (потенциально взвешенной мощности сигнала) дисперсии стандартного отклонения фазовой информации вдоль частоты.

Так как могут быть доступны только немного частот, для которых передаются остаточные сигналы, измерение согласованности может быть оценено только из немногих выборок вдоль частоты, приводя к измерению согласованности, которое только редко достигает экстремальных значений ("точно согласованный" или "точно несогласованный"). Таким образом, измерение согласованности может быть линейно или нелинейно искажено до использования для управления уровнем разделения переходных процессов. В варианте осуществления реализована пороговая характеристика, как иллюстрировано на Фиг. 8, правый пример.

Фиг. 8 изображает различные примерные отображения из измерений согласованности фаз в уровни разделения переходных процессов, иллюстрируя воздействие вариантов для того, чтобы получить параметры обработки сигнала переходного процесса на надежность для ошибочной классификации переходных процессов. Варианты для получения информации разделения сигнала переходного процесса и упомянутая выше фазовая информация отличаются скоростью передачи данных параметров и, поэтому, представляют различные операционные точки относительно полной скорости передачи битов кодека, реализующего предложенный способ обработки сигнала переходного процесса. Кроме этого, выбор источника для получения фазовой информации также затрагивает аспекты, такие как надежность для ложных классификаций переходных процессов: обработка сигнала без переходных процессов как с переходными процессами вызывает менее слышимые искажения, если корректная фазовая информация применяется в обработке переходных процессов. Таким образом, ошибка классификации сигнала вызывает менее серьезные артефакты в сценарии переданных фазовых значений по сравнению со сценарием случайного генерирования фаз в декодере.

Фиг. 9 является кратким обзором системы ′′один в два′′ с обработкой переходных процессов согласно дополнительному варианту осуществления, в котором передаются остаточные сигналы узкого частотного диапазона. Данные Δφ фаз оценивают из фазового отношения между сигналом (DMX) понижающего микширования и остаточным сигналом в частотном диапазоне(ах) остаточного сигнала. Опционально, данные коррекции фаз передаются, чтобы снизить ошибку оценки фаз.

Фиг. 9 иллюстрирует блок 910 отделения сигнала переходного процесса, декоррелятор 920 сигнала переходного процесса, решетчатый IIR декоррелятор 930, блок 940 объединения, микшер 952, опциональный блок 954 формирования, первый блок 956 суммирования и второй блок 958 суммирования, которые соответствуют блоку 510 разделения переходных процессов, декоррелятору 520 сигнала переходного процесса, решетчатому IIR декоррелятору 530, блоку 540 объединения, микшеру 552, опциональному блоку 554 формирования, первому блоку 556 суммирования и второму блоку 558 суммирования из варианта осуществления на Фиг. 5, соответственно. Кроме того, вариант осуществления согласно Фиг. 8 содержит блок 960 оценки фаз. Блок 960 оценки фаз принимает входной сигнал DMX, остаточный сигнал "остаточный сигнал" и, опционально, данные коррекции фаз. На основании принятой информации блок информации фазы вычисляет данные Δφ фаз. Опционально, блок оценки фаз также определяет информацию согласованности фаз и передает информацию согласованности фаз на блок 910 отделения сигнала переходного процесса. Например, информация согласованности фаз может быть использована блоком отделения переходного процесса, чтобы управлять уровнем разделения переходных процессов.

Вариант осуществления на Фиг. 9 применяет обнаружение, что если остаточные сигналы передаются в схеме кодирования способом неполного частотного диапазона, средняя разность фаз взвешенной мощности сигнала между остаточным сигналом и сигналом понижающего микширования (Δφresiduai_bands) может применяться как широкополосная фазовая информация к разделенным переходным процессам (Δφ=Δφresidual_bands). В этом случае, дополнительная фазовая информация не должна быть передана, снижая требование скорости передачи битов для обработки сигнала переходного процесса. В варианте осуществления на Фиг. 9 оценка фаз из частотных диапазонов остаточных сигналов может значительно отклоняться от более точной широкополосной оценки фаз, которая доступна в кодере. Поэтому опция состоит в том, чтобы передать данные коррекции фаз (например, Δφcorrection Δφ-Δφresidual_bands) таким образом, чтобы корректные Δφ были доступны в декодере. Однако, так как Δφcorrection может показать более низкую энтропию, чем Δφ, необходимая скорость передачи данных параметров может быть ниже, чем скорость передачи, которая будет необходима для передачи Δφ. (Это понятие аналогично общему использованию предсказания в кодировании: вместо непосредственного кодирования данных, кодируется ошибка предсказания с более низкой энтропией. В варианте осуществления согласно Фиг. 9 этап предсказания является экстраполяцией фаз из диапазонов частот остаточных сигналов до частотных диапазонов неостаточных сигналов). Согласованность разности фаз в диапазонах частот остаточных сигналов (Δφresidual_bands) вдоль оси частоты может быть использована для управления уровнем разделения переходных процессов.

В вариантах осуществления декодер может принимать фазовую информацию из кодера, или декодер может самостоятельно определить фазовую информацию. Кроме того, декодер может принять информацию разделения переходного процесса из кодера, или декодер может самостоятельно определить информацию разделения переходного процесса.

В вариантах осуществления аспект обработки сигнала переходного процесса является применением понятия "семантической декорреляции′′, описанного в WO/2010/017967 вместе с понятием "декоррелятора сигнала переходного процесса", которое основано на умножении входного сигнала на фазовые составляющие. Перцепционное качество воспроизведенных подобных аплодисментам сигналов улучшается, так как оба этапа обработки избегают изменения временной структуры переходных сигналов. Кроме того, пространственное распределение переходных процессов, а также фазовые отношения между переходными процессами, восстанавливается в выходных каналах. Кроме того, варианты осуществления также в вычислительном отношении являются эффективными и могут легко интегрироваться в подобные PS или MPS системы повышающего микширования. В вариантах осуществления обработка переходных процессов не затрагивает обработку матрицы микширования таким образом, чтобы все пространственные свойства воспроизведения, которые определены матрицей микширования, также применялись к сигналу переходного процесса.

В вариантах осуществления применяется новая схема декорреляции, которая в частности подходит для применения в системах повышающего микширования, которая в частности подходит для применения схем пространственного кодирования аудио, таких как PS или MPS, и которая улучшает перцепционное качество выходных сигналов в случае подобных аплодисментам сигналов, то есть сигналов, которые содержат плотные смеси пространственно распределенных переходных процессов и/или могут быть замечены как особенно расширенная реализация общей структуры "семантической декорреляции". Кроме того, в вариантах осуществления содержится новая схема декорреляции, которая восстанавливает пространственное/временное распределение переходных процессов, аналогичных распределению в исходном сигнале, сохраняет временную структуру сигналов переходных процессов, учитывает изменение скорости передачи битов в зависимости от компромисса качества и/или идеально подходит для комбинации с признаками MPS как остаточные сигналы неполного частотного диапазона или GES. Комбинации являются комплементарными, то есть: информация стандартных признаков MPS повторно используется для обработки сигналов переходных процессов.

Фиг. 10 иллюстрирует устройство для кодирования аудио сигнала, имеющего множество каналов. Два входных канала L, R вводятся в понижающий микшер 1010 и в блок вычисления 1020 остаточного сигнала. В других вариантах осуществления множество каналов вводится в понижающий микшер 1010 и блок вычисления 1020 остаточного сигнала, например, 3, 5 или 9 каналов окружения. Понижающий микшер 1010 затем микширует с понижением эти два канала L, R, чтобы получить сигнал понижающего микширования. Например, понижающий микшер 1010 может использовать матрицу микширования и выполнить матричное умножение матрицы микширования и двух входных каналов L, R, чтобы получить сигнал понижающего микширования. Сигнал понижающего микширования может быть передан на декодер.

Кроме того, генератор 1020 остаточного сигнала приспособлен для вычисления дополнительного сигнала, который называется остаточным сигналом. Остаточные сигналы являются сигналами, которые могут быть использованы для восстановления исходных сигналов, дополнительно используя сигнал понижающего микширования и матрицу повышающего микширования. Когда, например, N сигналов микшируются с понижением в 1 сигнал, сигнал понижающего микширования обычно составляет 1 из N компонентов, которое возникает в результате отображения N входных сигналов. Оставшиеся компоненты, возникающие в результате отображения (например, N-1 компонентов), являются остаточными сигналами и позволяют восстановить исходные N сигналов посредством обратного отображения. Отображение может, например, быть вращением. Отображение должно проводиться таким образом, чтобы сигнал понижающего микширования максимизировался, а остаточные сигналы минимизировались, например, аналогично преобразованию главной оси. Например, энергия сигнала понижающего микширования должна максимизироваться, а энергия остаточных сигналов должна быть минимизирована. При понижающем микшировании 2 сигналов в 1 сигнал, понижающее микширование обычно составляет один из двух компонентов, которые возникают в результате отображения 2 входных сигналов. Оставшийся компонент, возникающий в результате отображения, является остаточным сигналом и позволяет восстановить исходные 2 сигнала посредством обратного отображения.

В некоторых случаях остаточный сигнал может представлять ошибку, ассоциированную с представлением двух сигналов посредством их понижающего микширования и ассоциированных параметров. Например, остаточный сигнал может быть сигналом ошибки, который представляет ошибку между исходными каналами L, R и каналами L', R', возникающими в результате повышающего микширования сигнала понижающего микширования, который был сгенерирован на основании исходных каналов L и R.

Другими словами, остаточный сигнал может быть рассмотрен как сигнал во временной области или частотной области, или области частотного поддиапазона, которые вместе с только сигналом понижающего микширования или с сигналом понижающего микширования и параметрической информацией позволяют корректную или почти корректную реконструкцию исходного канала. Термин ′′почти корректная реконструкция′′ должен быть понят, что реконструкция с остаточным сигналом, имеющим энергию, больше чем ноль, ближе к исходному каналу по сравнению с реконструкцией, использующей понижающее микширование без остаточного сигнала или использующей понижающее микширование и параметрическую информацию без остаточного сигнала.

Кроме того, кодер содержит блок 1030 вычисления фазовой информации. Сигнал понижающего микширования и остаточный сигнал вводятся в блок 1030 вычисления фазовой информации. Блок 1030 вычисления фазовой информации затем вычисляет информацию относительно разности фаз между сигналом понижающего микширования и остаточным сигналом, чтобы получить фазовую информацию. Например, блок вычисления фазовой информации может применять функции, которые вычисляют кросс-корреляцию сигнала понижающего микширования и остаточного сигнала.

Кроме того, кодер содержит генератор 1040 выходного сигнала. Фазовая информация, генерируемая блоком 1030 вычисления фазовой информации, вводится в генератор 1040 выходного сигнала. Генератор 1040 выходного сигнала затем выводит фазовую информацию.

В варианте осуществления устройство дополнительно содержит блок квантования фазовой информации для того, чтобы квантовать фазовую информацию. Фазовая информация, генерируемая блоком вычисления фазовой информации, может вводиться в блок квантования фазовой информации. Блок квантования фазовой информации затем квантует фазовую информацию. Например, фазовая информация может быть отображена в 8 различных значений, например, в одно из значений 0, 1, 2, 3, 4, 5, 6 или 7. Эти значения могут представлять разности фаз 0, π/4, π/2, 3π/4, π, 5π/4, 3π/2 и 7π/4, соответственно. Квантованная фазовая информация затем может быть введена в генератор 1040 выходного сигнала.

Кроме того, в дополнительном варианте осуществления устройство содержит кодер без потерь. Фазовая информация из блока 1040 вычисления фазовой информации или квантованная фазовая информация из блока квантования фазовой информации может быть введена в кодер без потерь. Кодер без потерь приспособлен для кодирования фазовой информации посредством применения кодирования без потерь. Может быть использован любой вид схемы кодирования без потерь. Например, кодер может использовать арифметическое кодирование. Кодер без потерь затем вводит закодированную фазовую информацию без потерь в генератор 1040 выходного сигнала.

Относительно декодера и кодера и способов описанных вариантов осуществления упомянуто следующее:

Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствуют этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или признака соответствующего устройства.

В зависимости от некоторых требований реализации варианты осуществления настоящего изобретения могут быть реализованы в аппаратном обеспечении или в программном обеспечении. Реализация может быть выполнена, используя цифровой носитель данных, например дискету, DVD, CD, ROM, PROM, EPROM, EEPROM или флэш-память, имеющую электронно считываемые сигналы управления, сохраненные на ней, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой таким образом, чтобы был выполнен соответствующий способ.

Некоторые варианты осуществления согласно настоящему изобретению содержат несущую информации, имеющую электронно считываемые сигналы управления, которые способны взаимодействовать с программируемой компьютерной системой таким образом, чтобы был выполнен один из способов, описанных в настоящем описании.

В целом, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, причем программный код работает для выполнения одного из способов, когда компьютерный программный продукт работает на компьютере. Программный код может, например, быть сохранен на считываемой машиной несущей.

Другие варианты осуществления содержат компьютерную программу для выполнения одного из способов, описанных в настоящем описании, сохраненных на считываемой машиной несущей или невременном запоминающем носителе.

Другими словами, поэтому, вариантом осуществления способа настоящего изобретения является компьютерная программа, имеющая программный код для выполнения одного из способов, описанных в настоящем описании, когда компьютерная программа работает на компьютере.

Поэтому дополнительным вариантом осуществления способов настоящего описания является носитель информации (или цифровой носитель данных или считываемый компьютером носитель), содержащий записанную на нем компьютерную программу для выполнения одного из способов, описанных в настоящем описании.

Поэтому дополнительным вариантом осуществления способа настоящего изобретения является поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в настоящем описании. Эти поток данных или последовательность сигналов, например, могут быть сконфигурированы для передачи с помощью соединения передачи данных, например, с помощью Интернет.

Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, сконфигурированное или приспособленное для выполнения одного из способов, описанных в настоящем описании.

Дополнительный вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных в настоящем описании.

В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для выполнения некоторых или всех функциональных возможностей способов, описанных в настоящем описании. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для выполнения одного из способов, описанных в настоящем описании. В целом, способы предпочтительно выполняются любым устройством аппаратного обеспечения.

Вышеупомянутые описанные варианты осуществления являются просто иллюстративными для принципов настоящего изобретения. Должно быть понятно, что модификации и изменения мер и подробностей, описанных в настоящем описании, будут очевидны для других специалистов в данной области техники. Поэтому цель заключается только в ограничении посредством объема охраны нижеприведенной формулы изобретения, а не конкретных подробностей, представленных посредством описания и объяснения вариантов осуществления в настоящем описании.

1. Устройство для генерирования декоррелированного сигнала, содержащее:
блок (650) приема для приема фазовой информации;
блок (310; 410; 510; 610; 710; 910) отделения сигнала с переходным процессом для разделения входного сигнала на первый компонент сигнала и на второй компонент сигнала таким образом, чтобы первый компонент сигнала содержал части сигнала с переходным процессом входного сигнала, и таким образом, чтобы второй компонент сигнала содержал части сигнала без переходного процесса входного сигнала;
декоррелятор (320; 420; 520; 620; 720; 920) сигнала с переходным процессом для декорреляции первого компонента сигнала согласно первому способу декорреляции, чтобы получить первый компонент декоррелированного сигнала;
дополнительный второй декоррелятор (330; 430; 530; 630; 730; 930) для декорреляции второго компонента сигнала согласно второму способу декорреляции, чтобы получить второй компонент декоррелированного сигнала, при этом второй способ декорреляции отличается от первого способа декорреляции; и
блок (340; 440; 540; 640; 740; 940) объединения для объединения первого компонента декоррелированного сигнала и второго компонента декоррелированного сигнала, чтобы получить декоррелированный выходной сигнал; и
при этом декоррелятор (320; 420; 520; 620; 720; 920) сигнала с переходным процессом приспособлен для применения фазовой информации к первому компоненту сигнала.

2. Устройство по п. 1,
в котором блок (650) приема приспособлен для приема фазовой информации от кодера, и при этом декоррелятор (320; 420; 520; 620; 720; 920) сигнала с переходным процессом приспособлен для применения фазовой информации к первому компоненту сигнала.

3. Устройство по п. 1,
в котором блок (310; 410; 510; 610; 710; 910) отделения сигнала с переходным процессом адаптирован для разделения входного сигнала, который представлен в частотной области.

4. Устройство по п. 1,
в котором фазовая информация указывает разность фаз между остаточным сигналом и сигналом понижающего микширования, и при этом декоррелятор (320; 420; 520; 620; 720; 920) сигнала с переходным процессом приспособлен для декоррелирования первого компонента сигнала посредством применения фазовой информации к первому компоненту сигнала.

5. Устройство по п. 4,
в котором фазовая информация указывает разность фаз между остаточным сигналом и сигналом понижающего микширования по отношению к некоторому частотному диапазону, и при этом декоррелятор (320; 420; 520; 620; 720; 920) сигнала с переходным процессом приспособлен для декоррелирования первого компонента сигнала посредством применения фазовой информации к первому компоненту сигнала.

6. Устройство по п. 1,
в котором фазовая информация указывает разность фаз между остаточным сигналом и сигналом понижающего микширования, причем разность фаз является не зависимым от частоты широкополосным параметром, и при этом декоррелятор (320; 420; 520; 620; 720; 920) сигнала с переходным процессом приспособлен для декоррелирования первого компонента сигнала посредством применения фазовой информации к первому компоненту сигнала.

7. Устройство по п. 1,
в котором декоррелятор (320; 420; 520; 620; 720; 920) сигнала с переходным процессом приспособлен для получения фазовой составляющей из фазовой информации, и причем декоррелятор (320; 420; 520; 620; 720; 920) сигнала с переходным процессом дополнительно приспособлен для применения фазовой составляющей к первому компоненту сигнала.

8. Устройство по п. 7, в котором декоррелятор (320; 420; 520; 620; 720; 920) сигнала с переходным процессом приспособлен для применения фазовой составляющей к первому компоненту сигнала посредством умножения фазовой составляющей на первый компонент сигнала.

9. Устройство по п. 1,
в котором устройство дополнительно приспособлено для приема информации разделения сигнала с переходным процессом, указывающей, содержит ли часть сигнала входного сигнала переходный процесс,
причем блок (310; 410; 510; 610; 710; 910) отделения сигнала с переходным процессом разделяет входной сигнал на первый компонент сигнала и на второй компонент сигнала на основании информации разделения сигнала с переходным процессом.

10. Устройство по п. 1,
в котором блок (340; 440; 540; 640; 740; 940) объединения приспособлен для объединения первого компонента декоррелированного сигнала и второго компонента декоррелированного сигнала посредством суммирования первого компонента декоррелированного сигнала и второго компонента декоррелированного сигнала.

11. Способ для генерирования декоррелированного сигнала, содержащий:
прием фазовой информации;
разделение входного сигнала на первый компонент сигнала и на второй компонент сигнала таким образом, чтобы первый компонент сигнала содержал части сигнала с переходным процессом входного сигнала, и таким образом, чтобы второй компонент сигнала содержал части сигнала без переходного процесса входного сигнала;
декорреляцию первого компонента сигнала согласно первому способу декорреляции, чтобы получить первый компонент декоррелированного сигнала;
декорреляцию второго компонента сигнала согласно второму способу декорреляции, чтобы получить второй компонент декоррелированного сигнала, при этом второй способ декорреляции отличен от первого способа декорреляции; и
объединение первого компонента декоррелированного сигнала и второго компонента декоррелированного сигнала, чтобы получить декоррелированный выходной сигнал;
при этом принятая фазовая информация применяется к первому компоненту сигнала.

12. Считываемый компьютером носитель, содержащий сохраненную на нем компьютерную программу, реализующую способ по п. 11.



 

Похожие патенты:

Изобретение относится к средствам для обработки аудиоданных и к области техники связи. Технический результат заключается в повышении эффективности кодирования.

Изобретение относится к области обеспечения представления сигнала повышающего микширования на основе представления сигнала понижающего микширования и объектно-связанной параметрической информации, которые включены в представление битового потока звукового содержания, и информации о визуализации.

Изобретение относится к средствам, генерирующим представление сигнала повышающего микширования на основе представления сигнала понижающего микширования с использованием объектно-ориентированной параметрической информации и с учетом данных аудиорендеринга.

Изобретение относится к способу кодирования аудио сигнала и средствам для осуществления этого способа. Технический результат изобретения заключается в создании концепции кодирования, позволяющей уменьшить сложность при сопоставимой или даже увеличенной эффективности кодирования.

Изобретение относится к кодеку, поддерживающему переключение между режимом кодирования с преобразованием с подавлением помех дискретизации во временной области и режимом кодирования временной области.

Изобретение относится к области обработки аудиосигнала и аудиокодирования. Технический результат - повышение точности кодирования и декодирования.

Изобретение относится к кодированию аудио-файлов с высоким качеством и низкой частотой следования битов. Технический результат заключается в оптимизации настроек конфигурации для всех канальных элементов одновременно.

Изобретение относится к средствам для кодирования/декодирования временного сегмента аудиосигнала. Технический результат заключается в повышении эффективности кодирования в аудиокодере с преобразованием.

Изобретение относится к средствам кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра. Технический результат заключается в повышении качества кодированного аудиосигнала.

Изобретение относится к средствам для генерирования декоррелированного сигнала. Технический результат заключается в повышении эффективности генерирования декоррелированного сигнала.

Изобретения относятся к области цифровой связи и технологиям обработки речи в условиях зашумления. Технический результат заключается в повышении отношения сигнал-шум очищенного речевого сигнала. Применяют способы фильтрации зашумленного речевого сигнала в условиях сложной помеховой обстановки. Для чего используют результаты полиспектрального анализа с целью точной оценки спектральных характеристик шумового воздействия. В заявленных способах осуществляется спектральное вычитание с дополнительной коррекцией сигналов на основе процедуры эмпирической модовой декомпозиции и адаптивной цифровой фильтрацией низких частот с применением коэффициента бикорреляции, полученного путем анализа суммарной бикорреляции в зонах сосредоточения низкоплотностной области биамплитуды обрабатываемого сегмента зашумленного речевого сигнала. 3 н.п. ф-лы, 10 ил.

Изобретение относится к средствам кодирования и декодирования многоканального звукового сигнала. Технический результат заключается в повышении качества кодированного сигнала. Способ кодирования многоканального входного звукового сигнала включает этапы формирования понижающего микширования низкочастотных составляющих подмножества каналов входного сигнала, кодирования формы сигнала каждого канала понижающего микширования, формируя тем самым подвергнутые понижающему микшированию данные с кодированной формой сигнала, выполнения параметрического кодирования по меньшей мере некоторых верхних частотных составляющих каждого канала входного сигнала, формируя тем самым параметрически кодированные данные, и формирования кодированного звукового сигнала (например, кодированного сигнала в формате E-AC-3), указывающего на подвергнутые понижающему микшированию данные с кодированной формой сигнала и параметрически кодированные данные. Другие аспекты представляют собой способы декодирования такого кодированного сигнала и системы, выполненные с возможностью выполнения любого варианта осуществления способа согласно изобретению. 4 н. и 26 з.п. ф-лы, 4 ил., 1 табл.

Изобретение относится к вычислительной технике. Технический результат заключается в адаптивном применении низкочастотной коррекции в ходе кодирования звуковых сигналов, содержащих выраженные низкочастотные тональные составляющие, без изменения декодера. Способ кодирования звука, включающий выполнение обнаружения тональности на аудиоданных в частотной области с целью генерирования данных управления коррекцией, указывающих, имеет ли выраженное тональное содержимое каждая низкочастотная полоса набора по меньшей мере из некоторых низкочастотных полос аудиоданных; генерирование предварительного значения маскировки для аудиоданных в полосе для каждой указанной низкочастотной полосы; определение значений маскировки для аудиоданных полосы для каждой из указанных низкочастотных полос, при этом значения маскировки для аудиоданных в каждой указанной низкочастотной полосе, имеющей выраженное тональное содержимое, что указывается данными управления коррекцией, получают путем выполнения низкочастотной коррекции для коррекции предварительного значения маскировки аудиоданных в полосе, и значение маскировки для каждой другой низкочастотной полосы в наборе представляет собой предварительное значение маскировки для аудиоданных полосы. 4 н. и 24 з.п. ф-лы, 7 ил.

Изобретение относится к средствам кодирования цифрового звукового сигнала. Технический результат заключается в сокращении количества бит, необходимого для передачи закодированного сигнала без изменения качества кодирования. Кодируют предыдущий фрейм отсчетов цифрового сигнала посредством предсказательного кодирования. Кодируют текущий фрейм отсчетов цифрового сигнала посредством кодирования с преобразованием. Способ осуществляют таким образом, что первую часть текущего фрейма дополнительно кодируют посредством предсказательного кодирования, сокращенного относительно предсказательного кодирования предыдущего фрейма посредством повторного использования по меньшей мере одного параметра предсказательного кодирования предыдущего фрейма и кодирования только не используемых повторно параметров указанной первой части текущего фрейма. Объектом изобретения является также способ декодирования, соответствующий описанному способу кодирования. Его объектом являются также кодер и декодер, в которых соответственно применяют описанные способы кодирования и декодирования. 6 н. и 11 з.п. ф-лы, 13 ил.

Изобретение относится к средствам обработки речевого/аудио сигнала. Технический результат заключается в обеспечении комфортного воспроизведения звука во время переключения полосы пропускания речевых/аудио сигналов. Способ обработки речевого/аудио сигнала включает в себя этапы, на которых при переключении полосы пропускания речевого/аудио сигнала получают исходный высокочастотный сигнал, соответствующий текущему кадру речевого/аудио сигнала; получают глобальный параметр усиления исходного высокочастотного сигнала во временной области; выполняют обработку взвешивания для отношения энергий и глобального параметра усиления во временной области и используют полученное взвешенное значение в качестве предсказанного глобального параметра усиления, причем отношение энергий представляет собой отношение между энергией архивного кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала; корректируют исходный высокочастотный сигнал с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; и синтезируют текущий кадр узкополосного сигнала во временной области и скорректированный высокочастотный сигнал во временной области и выводят синтезированный сигнал. 4 н. и 19 з.п. ф-лы, 10 ил.

Изобретение относится к средствам генерирования шума в аудиокодеках. Технический результат заключается в обеспечении уменьшения скорости передачи битов и в повышении качества генерируемого шума. Аудиокодер содержит модуль оценки фонового шума, выполненный с возможностью определять параметрическую оценку фонового шума на основе представления в форме спектрального разложения входного аудиосигнала таким образом, что параметрическая оценка фонового шума спектрально описывает спектральную огибающую фонового шума входного аудиосигнала. Аудиокодер содержит кодер для кодирования входного аудиосигнала в поток данных в течение активной фазы. Аудиокодер содержит детектор, выполненный с возможностью обнаруживать вход в неактивную фазу после активной фазы на основе входного сигнала. Аудиокодер выполнен с возможностью кодировать в поток данных параметрическую оценку фонового шума в неактивной фазе. 7 н. и 11 з.п. ф-лы, 13 ил.

Изобретение относится к средствам кодирования и декодирования закодированного аудиосигнала. Технический результат заключается в обеспечении кодирования и декодирования информации импульсов с использованием меньшего количества битов для представления информации импульсов, что обеспечит возможность уменьшения скорости передачи соответствующим образом закодированного аудиосигнала. Устройство содержит декодер информации импульсов и декодер сигналов. Декодер информации импульсов выполнен с возможностью декодировать множество позиций импульсов, причем каждая из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, и причем декодер информации импульсов выполнен с возможностью декодировать множество позиций импульса посредством использования количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек, и одного номера состояния. 6 н. и 9 з.п. ф-лы, 7 ил.

Изобретение относится к аудиокодеку, поддерживающему синтез шума в течение неактивных фаз. Техническим результатом является уменьшение скорости передачи битов с поддержанием достижимого качества формирования шума. Параметрическая оценка фонового шума непрерывно обновляется в течение активной фазы или фазы немолчания, так что формирование шума может начинаться сразу при переходе к неактивной фазе после активной фазы. Спектральная область очень эффективно используется для того, чтобы параметризовать фоновый шум, за счет этого обеспечивая синтез фонового шума, который является более реалистичным и в силу этого приводит к более прозрачному переключению активной фазы на неактивную. 5 н. и 22 з.п. ф-лы, 13 ил.

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении регулировки общего усиления без декодирования и дополнительного этапа повторного кодирования. Многорежимный аудио декодировщик для формирования декодированного представления аудио контента на основе закодированного потока, который настроен на декодирование значения коэффициента общего усиления в фрейме из закодированного потока битов, причем первое подмножество фреймов кодируется в первом режиме кодирования, а второе подмножество фреймов кодируется во втором режиме кодирования, причем каждый фрейм второго подмножества состоит более чем из одного подфрейма, декодирование, для подфрейма, состоящего, по крайней мере, из подмножества подфреймов второго подмножества фреймов, соответствующего элемента битового потока независимо от значения глобального коэффициента усиления соответствующего фрейма и завершающее декодирование битового потока с использованием значения коэффициента общего усиления и соответствующего элемента битового потока при декодировании подфреймов из подмножества подфреймов второго подмножества фреймов и значения коэффициента общего усиления при декодировании первого подмножества фреймов. 19 н. и 19 з.п. ф-лы, 11 ил.

Изобретение относится к области обработки звука, а именно к области параметрического пространственного преобразования звука с трансформацией первого параметрического пространственного аудиосигнала во второй параметрический пространственный аудиосигнал. Технический результат заключается в обеспечении возможности задания виртуального места нахождения и/или перцептивной пространственной ориентации слушателя, которые отличаются от локализации точек снятия звука или положения слушателя во время записи пространственной звуковой сцены. Технический результат достигается за счет устройства, включающего в свою конструкцию: модификатор пространственного аудиосигнала, предназначенный для корректировки первого параметрического пространственного аудиосигнала в зависимости от изменения первоначального местоположения слушателя или первоначальной ориентации слушателя с формированием второго параметрического пространственного аудиосигнала, при этом второе местоположение слушателя или вторичная ориентация слушателя соответствуют первоначальному положению слушателя или первоначальной ориентации слушателя с внесением соответствующих изменений. 8 н. и 14 з.п. ф-лы, 9 ил.
Наверх