Способ обработки аудиосигнала и устройство для его осуществления

Авторы патента:

ФАЛЛЕР Кристоф (CH)

ОХ Хиен О (KR)

ДЗУНГ Йанг Вон (KR)

G10L19 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2419168:

ЭлДжи ЭЛЕКТРОНИКС ИНК. (KR)

Изобретение относится к способу и устройству для обработки аудиосигнала, в частности широковещательного сигнала или т.п. Техническим результатом является упрощение управления усилением и панорамированием объекта без настройки пользователем каждого объекта с использованием предустановочной информации, установленной заранее или модифицированной на основе выбора, сделанного пользователем. Указанный технический результат достигается тем, что способ содержит этапы, на которых: принимают сигнал понижающего микширования, объектную информацию и предустановочную информацию; создают информацию для обработки понижающего микширования с использованием объектной информации и предустановочной информации и обрабатывают сигнал понижающего микширования с использованием этой информации; создают многоканальную информацию с использованием объектной информации и предустановочной информации, в котором объектная информация содержит информацию об объектном уровне, объектной корреляции и объектном усилении, и где предустановочную информацию извлекают из указанного битового потока. 3 н. и 16 з.п. ф-лы, 19 ил.

Область техники, к которой относится изобретение

Настоящее изобретение относится к способу и устройству для обработки аудиосигнала. Хотя настоящее изобретение подходит для широкого спектра применений, в частности, оно пригодно для обработки аудиосигнала, принимаемого через цифровую среду, широковещательного сигнала или т.п.

Уровень техники

Обычно, в процессе понижающего микширования, содержащем множество объектов, до моно- или стереосигнала, из каждого объектного сигнала извлекают ряд параметров. Эти параметры могут использоваться декодером. При этом можно обеспечить управление панорамированием и усилением каждого из объектов на основе выбора, сделанного пользователем.

Раскрытие изобретения

Техническая проблема

Впрочем, для управления каждым объектным сигналом необходимо соответствующим образом позиционировать или панорамировать источники, включенные в операцию понижающего микширования. В случае, когда управление объектом осуществляет пользователь, неудобно управлять всеми объектными сигналами в целом. Также могут возникнуть трудности с воспроизведением оптимального состояния аудиосигнала, содержащего множество объектов, нежели при экспертном управлении.

Кроме того, в случае, когда объектная информация для восстановления объектного сигнала от кодера не принимается, могут возникнуть трудности при управлении объектным сигналом, содержащимся в сигнале понижающего микширования.

Техническое решение

Соответственно, настоящее изобретение имеет своей целью создание устройства для обработки аудиосигнала и соответствующего способа, которые по существу разрешают одну или несколько из указанных проблем, возникающих из-за ограничений и недостатков существующего уровня техники.

Целью настоящего изобретения является обеспечение устройства для обработки аудиосигнала и соответствующего способа, с помощью которых можно обеспечить управление усилением и панорамированием объекта с использованием предустановочной информации, установленной заранее.

Другой целью настоящего изобретения является обеспечение устройства для обработки аудиосигнала и соответствующего способа, с помощью которых предустановочную информацию, установленную заранее, можно транспортировать или запоминать отдельно от аудиосигнала.

Еще одной целью настоящего изобретения является обеспечение устройства для обработки аудиосигнала и соответствующего способа, с помощью которых можно обеспечить управление усилением и панорамированием объекта путем выбора одного из множества вариантов предварительно установленной предустановочной информации на основе выбора, сделанного пользователем.

Еще одной целью настоящего изобретения является обеспечение устройства для обработки аудиосигнала и соответствующего способа, с помощью которых можно обеспечить управление усилением и панорамированием объекта с использованием пользовательской предустановочной информации, введенной из внешней среды.

Другой целью настоящего изобретения является обеспечение устройства для обработки аудиосигнала и соответствующего способа, с помощью которых можно обеспечить управление аудиосигналом путем создания скрытой информации с использованием сигнала понижающего микширования, если от кодера не принято объектная информация.

Положительные результаты

Соответственно, настоящее изобретение обеспечивает следующие результаты или преимущества.

Прежде всего, можно обеспечить легкое управление усилением и панорамированием объекта без настройки пользователем каждого объекта с использованием предустановочной информации, установленной заранее.

Во-вторых, можно обеспечить управление усилением и панорамированием объекта с использованием предустановочной информации, модифицированной на основе выбора, осуществленного пользователем.

В-третьих, можно обеспечить удобное управление усилением и панорамированием объекта с использованием множества вариантов предустановочной информации, установленных заранее.

В-четвертых, можно обеспечить управление усилением и панорамированием объекта с использованием предустановочной информации различных видов путем использования пользовательской предустановочной информации, введенной из внешней среды.

В-пятых, можно обеспечить управление усилением и панорамированием объекта с использованием скрытой информации в случае использования кодера, неспособного создавать объектную информацию.

Описание чертежей

Сопроводительные чертежи, которые включены сюда для обеспечения детального понимания изобретения и которые являются составной частью этого описания, иллюстрируют варианты изобретения и вместе с описанием служат для объяснения принципов настоящего изобретения. На чертежах:

фиг.1 - блок-схема устройства обработки аудиосигнала согласно варианту настоящего изобретения;

фиг.2А и 2В - блок-схемы битового потока, транспортируемого в устройство обработки аудиосигнала согласно варианту настоящего изобретения;

фиг.3 - блок-схема блока создания информации, входящего в устройство обработки аудиосигнала, согласно варианту настоящего изобретения;

фиг.4 - блок-схема интерфейса битового потока, входящего в устройство обработки аудиосигнала, включая блок создания информации, показанный на фиг.3;

фиг.5 - блок-схема блока создания информации, входящего в устройство обработки аудиосигнала, согласно другому варианту настоящего изобретения;

фиг.6 - блок-схема интерфейса битового потока, входящего в устройство обработки аудиосигнала, включая блок создания информации, показанный на фиг.5;

фиг.7 - схема отображения пользовательского интерфейса, входящего в устройство обработки аудиосигнала, включая блок создания информации, показанный на фиг.5;

фиг.8 - блок-схема интерфейса битового потока, входящего в устройство обработки аудиосигнала, согласно еще одному варианту настоящего изобретения;

фиг.9 - блок-схема блока создания информации, входящего устройство обработки аудиосигнала, согласно еще одному варианту настоящего изобретения;

фиг.10А и 10В - схемы выходного сигнала в соответствии со способом обработки аудиосигнала согласно другому варианту настоящего изобретения;

фиг.11 - схема частотно-временной области для анализа выходного стереосигнала согласно другому варианту настоящего изобретения;

фиг.12А и 12В - блок-схемы процесса создания скрытой информации согласно другому варианту настоящего изобретения;

фиг.13 - блок-схема устройства обработки аудиосигнала согласно другому варианту настоящего изобретения;

фиг.14 - подробная блок-схема блока создания информации, включающего в себя показанную здесь часть для создания скрытой информации, согласно другому варианту настоящего изобретения;

фиг.15 - схема интерфейса битового потока, входящего в устройство обработки аудиосигнала, включая блок создания информации, показанный на фиг.14, согласно другому варианту настоящего изобретения; и

фиг.16 - блок-схема устройства обработки аудиосигнала согласно еще одному варианту настоящего изобретения.

Осуществление изобретения

В последующем описании излагаются дополнительные признаки и преимущества изобретения, которые отчасти станут очевидными из этого описания или могут быть выявлены при практической реализации изобретения. Цели и другие преимущества изобретения реализуются и достигаются с помощью структуры, детально раскрытой в письменном описании и формуле изобретения, а также в прилагаемых чертежах.

Для достижения этих и других преимуществ и согласно цели настоящего изобретения предложен материализованный и подробно описанный способ обработки аудиосигнала согласно настоящему изобретению, включающий в себя следующие шаги: прием сигнала понижающего микширования, объектной информации и предустановочной информации; создание информации для обработки понижающего микширования с использованием объектной информации и предустановочной информации; обработку сигнала понижающего микширования с использованием информации об обработке понижающего микширования; и создание многоканальной информации с использованием объектной информации и предустановочной информации, в котором объектная информация включает в себя по меньшей мере одно, выбираемое из группы, состоящей из информации об объектном уровне, информации об объектной корреляции и информации об объектном усилении; где информацию об объектном уровне создают путем нормализации объектного уровня, соответствующего объекту, с использованием одного из объектных уровней; где информацию об объектной корреляции создают из комбинации двух выбранных объектов; где информация об объектном усилении предназначена для определения вклада объекта для канала каждого сигнала понижающего микширования для создания сигнала понижающего микширования и где предустановочную информацию извлекают из битового потока.

Должно быть ясно, что это предварительное общее описание и последующее подробное описание носят иллюстративный и разъяснительный характер и предназначены для дополнительного пояснения изобретения, заявленного в формуле изобретения.

Вариант осуществления изобретения

Далее следуют ссылки на предпочтительные варианты изобретения, примеры которых показаны на сопроводительных чертежах.

В этом описании термин «информация» относится к значениям, параметрам, коэффициентам, элементам и всему тому подобному. Таким образом, смысл этого термина можно трактовать в каждом случае по-разному. Это не накладывает ограничение на настоящее изобретение.

На фиг.1 представлена блок-схема устройства обработки аудиосигнала согласно варианту настоящего изобретения.

Обратимся к фиг.1, где устройство 100 обработки аудиосигнала согласно варианту настоящего изобретения содержит блок 110 создания информации, блок 120 обработки понижающего микширования и многоканальный декодер 130.

Блок 110 создания информации принимает объектную информацию (OI) и предустановочную информацию (PI) из битового потока аудиосигнала. В этом случае объектной информацией (OI) является информация об объектах, включенная в сигнал (DMX) понижающего микширования, причем она может содержать информацию об объектном уровне, информацию об объектной корреляции и т.п. Информацию об объектном уровне создают путем нормализации объектного уровня с использованием эталонной информации. Эталонной информацией может быть один из объектных уровней и, в частности, самый высокий уровень из всех объектных уровней. Информация об объектной корреляции показывает корреляцию между двумя объектами, а также указывает, что два выбранных объекта являются сигналами разных каналов стереовыходов, имеющих один и тот же источник. Информация об объектном усилении указывает значение вклада объекта в каждый канал сигнала понижающего микширования и, в частности, значение для модификации вклада объекта.

Предустановочной информацией (PI) является информация, созданная на основе предустановочной информации о положении, предустановочной информации об усилении, информации о конфигурации воспроизведения и т.п. Предустановочную информацию (PI) также извлекают из битового потока.

Информацией о предустановочном положении является информация, установленная для управления положением или панорамированием каждого объекта. Предустановочная информация об усилении настраивает управление усилением каждого объекта и включает в себя коэффициент усиления для каждого объекта. Коэффициент усиления для каждого объекта может изменяться во времени. Также информацией о конфигурации воспроизведения является информация, содержащая количество динамиков, положение динамика, информацию об окружающем пространстве (виртуальное положение динамика) и т.п.

Термин «предустановочная информация» (PI) означает, что информация о положении объекта, информация об объектном усилении и информация о конфигурации воспроизведения согласно конкретному режиму и эффектам установлена заранее. Например, режим караоке в предустановочной информации может содержать предустановочную информацию об усилении, приводящую усиление вокального объекта в '0'. Режим стадиона может содержать предустановочную информацию о положении и предустановочную информацию об усилении для получения эффекта существования аудиосигнала в открытом пространстве. Устройство обработки аудиосигнала согласно настоящему изобретению облегчает регулировку усиления или панорамирования объекта путем выбора конкретного режима в предустановочной информации (PI), установленной заранее, без регулировки пользователем усиления или панорамирования каждого объекта.

Блок 110 создания информации способен кроме того, получать метаинформацию (MTI) (не показана) о предустановочной информации. Метаинформация (MTI) соответствует предустановочной информации (PI) и может содержать имя предустановочной информации (PI), имя производителя и т.п. В случае, когда имеется по меньшей мере два варианта предустановочной информации (PI), метаинформация (MTI) о каждом варианте предустановочной информации (OI) может содержаться и быть представлена в индексной форме. Метаинформация (MTI) воспроизводится пользовательским интерфейсом или т.п. и может быть использована в результате приема команды выбора от пользователя.

Блок 110 создания информации создает многоканальную информацию (MI), используя объектную информацию (OI) и предустановочную информацию (PI). Многоканальная информация (MI) обеспечивается для операции микширования с увеличением количества аудиоканалов в аудиоканале, которая выполняется над сигналом понижающего микширования (DMX) и может содержать информацию об уровне канала и информацию о корреляции канала. Блок 110 создания информации способен создавать информацию (DPI) для обработки сигнала понижающего микширования с использованием объектной информации (OI) и предустановочной информации (PI).

Блок 120 обработки понижающего микширования получает сигнал понижающего микширования (DMX), а затем обрабатывает сигнал понижающего микширования (DMX), используя информацию (DPI) для обработки понижающего микширования. Информация (DPI) для обработки понижающего микширования может использоваться для обработки сигнала понижающего микширования (DMX) для регулировки панорамирования или усиления сигнала каждого объекта, содержащегося в сигнале понижающего микширования (DMX).

Многоканальный декодер 130 получает обработанный сигнал понижающего микширования (PDMX) из блока 120 обработки понижающего микширования. Затем многоканальный декодер 130 создает многоканальный сигнал путем выполнения операции повышающего микширования, которая выполняется над обработанным сигналом понижающего микширования (PDMX), используя многоканальную информацию (MI), созданную блоком 110 создания информации.

На фиг.2А и 2В в качестве примеров показаны конфигурации битового потока, передаваемого в устройство обработки аудиосигнала согласно варианту настоящего изобретения.

Обратимся к фиг.2А, где битовый поток в целом, передаваемый из кодера, является единым интегрированным битовым потоком, содержащим сигнал понижающего микширования (Mixed_Obj BS), объектную информацию (Obj_Info BS) и предустановочную информацию (Preset_Info BS). Объектная информация и предустановочная информация могут запоминаться в побочной области или расширенной области битового потока сигнала понижающего микширования. Еще раз обратимся к фиг.2В, где битовый поток согласно одному варианту настоящего изобретения может запоминаться и транспортироваться в виде независимых битовых последовательностей в различных формах. Например, сигнал понижающего микширования (Mixed_Obj) может переноситься первым битовым потоком 202, а объектная информация (Obj_Info BS) и предустановочная информация (Preset_Info BS) могут переноситься вторым битовым потоком 204. Согласно другому варианту сигнал понижающего микширования (Mixed_Obj BS) и объектная информация (Obj_Info BS) переносится первым битовым потоком 206, а предустановочная информация (Preset_Info BS) может переноситься только отдельным, вторым битовым потоком 208. Согласно еще одному варианту сигнал понижающего микширования (Mixed_Obj BS), объектная информация (Obj_Info BS) и предустановочная информация (Preset_Info BS) могут переноситься тремя отдельными битовыми потоками 210, 212 и 214 соответственно.

Первый битовый поток, второй битовый поток или отдельные битовые потоки могут переноситься с одинаковыми или разными скоростями передачи битов. В частности, предустановочная информация (Preset_Info BS) (PI) может запоминаться и транспортироваться отдельно от сигнала понижающего микширования (Mixed_Obj BS) (DMX) или объектной информации (Obj_Info BS) (OI) после восстановления аудиосигнала.

Устройство обработки аудиосигнала согласно настоящему изобретению получает пользовательскую управляющую информацию (UCI) от пользователя, а также предустановочную информацию, переданную из кодера, а затем может отрегулировать усиление или панорамирование объектного сигнала с использованием пользовательской управляющей информации (UCI).

На фиг.3 представлена блок-схема блока 110 создания информации, входящего в устройство обработки аудиосигнала, согласно варианту настоящего изобретения.

Обратимся к фиг.3, где блок 110 создания информации содержит часть 310 для приема/передачи информации, часть 330 для приема предустановочной информации и часть 340 для создания информации, а также дополнительно содержит пользовательский интерфейс 320, получающий пользовательскую управляющую информацию (UCI).

Часть 310 для приема/передачи информации получает объектную информацию (OI) и предустановочную информацию (PI) из битового потока, транспортируемого из кодера. Между тем, пользовательский интерфейс 320 способен принимать отдельную пользовательскую управляющую информацию (UCI) от пользователя. В этом случае пользовательская управляющая информация (UCI) может содержать пользовательскую предустановочную информацию (UPI).

Пользовательский интерфейс 320 принимает пользовательскую управляющую информацию (UCI), чтобы решить, использовать ли предустановочную информацию (PI), введенную из кодера. Часть 330 для приема предустановочной информации получает предустановочную информацию (PI), переданную от кодера, или пользовательскую предустановочную информацию (UPI), полученную от пользователя. Если принято решение не использовать предустановочную информацию (PI) из пользовательской управляющей информации (UCI), то выбирают пользовательскую предустановочную информацию (UPI), а затем вводят ее в часть 330 для приема предустановочной информации для ее использования.

Часть 340 создания информации способна создавать многоканальную информацию (MI) с использованием предустановочной информации (PI) или пользовательской предустановочной информации (UPI), полученной от блока 330 приема предустановочной информации, и объектной информации (OI), полученной из части 310 для приема/передачи информации.

На фиг.4 показана схема интерфейса битового потока, входящего в устройство обработки аудиосигнала, включая блок создания информации, показанный на фиг.3. Согласно одному варианту настоящего изобретения битовый поток, введенный в декодер 410, содержит сигнал понижающего микширования (DMX), объектную информацию (OI), предустановочную информацию (PI) и пользовательскую предустановочную информацию (UPI). Битовый поток, выводимый из декодера, может содержать многоканальный сигнал (MI) и пользовательскую предустановочную информацию (UPI). Пользовательская предустановочная информация выводится из декодера 410, после чего она может быть записана в память 420 для многократного использования.

Далее со ссылками на фигуры с 5 по 7 подробно объясняется способ создания многоканальной информации (MI) с использованием модифицированной предустановочной информации (MPI), получаемой в результате модификации части предустановочной информации (PI), транспортируемой из кодера, с использованием пользовательской управляющей информации (UCI), введенной из пользовательского интерфейса.

На фиг.5 представлена блок-схема блока 110 создания информации, входящего в устройство обработки аудиосигнала, согласно другому варианту настоящего изобретения. На фиг.6 представлена схема интерфейса битового потока, входящего в устройство обработки аудиосигнала, включая блок создания информации, показанный на фиг.5, а на фиг.7 показана схема пользовательского интерфейса, входящего в устройство обработки аудиосигнала, включая блок создания информации, показанный на фиг.5. В последующем описании со ссылками на фигуры с 5 по 7 подробно объясняются соответствующие элементы и шаги.

Обратимся к фиг.5, где при вводе пользовательской управляющей информации (UCI), как показано на фиг.3 и фиг.4, предустановочная информация, переданная из кодера, удаляется, после чего может быть создана информация (DPI) об обработке понижающего микширования и многоканальная информация (MI)с использованием пользовательской предустановочной информации (UPI), содержащейся в пользовательской управляющей информации (UCI). Кроме того, пользовательская управляющая информация (UCI) позволяет создать модифицированную предустановочную информацию (MPI), как показано на фиг.5, путем модификации части предустановочной информации (PI), переданной исключительно от кодера.

Блок 110 создания информации, как показано на фиг.5, содержит часть 510 для приема/передачи информации, часть 530 для модификации предустановочной информации и часть 540 для создания информации, а кроме того содержит пользовательский интерфейс 520, получающий пользовательскую управляющую информацию (UCI).

Часть 510 для приема/передачи информации получает объектную информацию (OI) и предустановочную информацию (PI) из битового потока, транспортируемого из кодера. Кроме того, пользовательский интерфейс 520 отображает предустановочную информацию (PI) на экране, давая возможность пользователю управлять усилением и панорамированием каждого объекта.

Часть 530 для модификации предустановочной информации получает предустановочную информацию (PI) от части 510 для приема/передачи информации, после чего она может создать модифицированную предустановочную информацию (MPI) с использованием пользовательской управляющей информации (UCI), введенной из пользовательского интерфейса 520. Модифицированная предустановочная информация (MPI) может не подходить для объектов в целом. Если модифицированная предустановочная информация (MPI) подходит для частных объектов, то предустановочная информация по остальным объектам, которые не являются целями модификации, может поддерживаться нетронутой без модификации в части 530 для модификации предустановленной информации.

Часть 540 для создания информации способна создавать многоканальную информацию MI с использованием модифицированной предустановленной информации (MPI) и объектной информации, полученной от части 510 для приема/передачи информации.

На фиг.6 представлена схема интерфейса битового потока, входящего в устройство обработки аудиосигнала, включая блок 110 создания информации, показанный на фиг.5. Согласно одному варианту настоящего изобретения битовый поток, введенный в декодер 610, содержит сигнал понижающего микширования (DMX), объектную информацию (OI), предустановочную информацию (PI) и пользовательскую управляющую информацию (UCI). Битовый поток, выводимый из декодера 610, может содержать пользовательскую управляющую информацию (UCI), модифицированную предустановочную информацию (MPI) и многоканальный сигнал (MI). Пользовательская управляющая информация (UCI) и модифицированная предустановочная информация MPI выводятся из декодера 610, после чего возможно их раздельное запоминание в памяти 620 для многократного использования.

Обратимся к фиг.7, где предустановочная информация (PI), передаваемая из кодера, может отображаться в виде регулятора громкости или переключателя вместе с индексом (например, имя объекта, символ, таблица, соответствующая данному символу), согласно каждому объекту на пользовательском интерфейсе (UI). Часть для отображения пользовательского интерфейса (UI) может отображать модификацию предустановочной информации для каждого объекта в соответствии с модифицированной предустановочной информацией (MPI), когда предустановочная информация (PI) модифицирована посредством пользовательской управляющей информации (UCI). В случае наличия множества режимов, обеспеченных в виде предустановочной информации (PI), пользовательский интерфейс (UI) отражает информацию о режимах в соответствии с множеством вариантов предустановочной информации (PI), установленных в отображающей части, после чего возможно отображение предустановочной информации (PI) того режима, который выбран пользователем.

На фиг.8 представлена схема интерфейса битового потока устройства обработки аудиосигнала согласно еще одному варианту настоящего изобретения. Декодер-1 810, содержащий часть для создания информации, показанную на фиг.5, получает сигнал понижающего микширования (DMX), объектную информацию (OI), предустановочную информацию (PI) и пользовательскую управляющую информацию (UCI), после чего он способен выводить многоканальный сигнал (MI), пользовательскую управляющую информацию (UCI) и модифицированную предустановочную информацию (MPI). Пользовательская управляющая информация (UCI) и модифицированная предустановочная информация (MPI) могут отдельно запоминаться в памяти 820. Сигнал понижающего микширования (DMX) и объектная информация (OI), соответствующая модифицированной предустановочной информации (MPI), могут вводиться в декодер-2830. В этом случае использование модифицированной предустановочной информации (MPI), хранящейся в памяти 820, позволяет декодеру-2 830 создавать многоканальный сигнал, идентичный прежнему многоканальному сигналу, созданному декодером-1 810.

Модифицированная предустановочная информация (MPI) может иметь разное значение для каждого кадра. Модифицированная предустановочная информация (MPI) может иметь значение, характерное для музыкального «сингла», и может содержать метаинформацию, описывающую характерные признаки или производителя. Благодаря тому, что модифицированная предустановочная информация (MPI) транспортируется и запоминается отдельно от многоканального сигнала, она может использоваться только на законной основе.

Устройство обработки аудиосигнала согласно другому варианту настоящего изобретения может содержать множество вариантов предустановочной информации (PI). Далее подробно объясняется процесс создания многоканальной информации.

На фиг.9 показана схема блока создания информации, входящего в устройство обработки аудиосигнала, согласно еще одному варианту настоящего изобретения.

Обратимся к фиг.9, где блок 110 создания информации содержит часть 910 для приема/передачи информации, часть 930 для определения предустановочной информации и часть 940 для создания информации, причем блок 110 также включает в себя пользовательский интерфейс 920, способный принимать пользовательскую управляющую информацию (UCI).

Блок 910 приема/передачи информации принимает объектную информацию (OI) и предустановочную информацию (PI_n) из битового потока, транспортируемого из кодера. Варианты предустановочной информации могут быть сконфигурированы в виде множества режимов предустановки, таких как режим караоке, режим R&B выделения и т.п.

Между тем, пользовательский интерфейс 920 отображает схематическую информацию о вариантах предустановочной информации (PI_n) на экране для предоставления их пользователю и способен принимать от пользователя пользовательскую управляющую информацию (UCI) для выбора предустановочной информации.

Часть 930 для определения предустановочной информации способна определить одну предустановочную информацию (PI) среди вариантов предустановочной информации (PI_n), введенных из блока 910 для приема/передачи информации, с использованием пользовательской управляющей информации.

Например, как показано на фиг.9, в случае, когда предустановочная информация_1, предустановочная информация_2, предустановочная информация_3 и предустановочная информация_4 соответствуют режиму караоке, режиму R&B выделения, режиму преобразования и акустическому режиму соответственно, на пользовательском интерфейсе 920 отображается название режима, соответствующее каждому варианту предустановочной информации (PI). Если пользователь пытается получить звуковую сцену, которая дает эффект открытого пространства, то можно выбрать предустановочную информацию_3. Пользовательский интерфейс 920 выводит пользовательскую управляющую информацию (UCI) для выбора варианта предустановочной информации_3, введенной пользователем. Блок 930 определения предустановочной информации определяет выбранную предустановочную информацию_3 в качестве предустановочной информации (PI), используя пользовательскую управляющую информацию (UCI), а затем выводит ее в часть 940 для создания информации.

Часть 940 для создания информации способна создавать многоканальную информацию (MI) с использованием предустановочной информации (PI), полученной от блока 930 приема предустановочной информации, и объектной информации (OI), полученной из блока 910 передачи/приема информации.

Устройство обработки аудиосигнала согласно настоящему изобретению способно регулировать усиление или панорамирование объекта путем выбора и применения предварительно установленной оптимальной предустановочной информации с использованием множества вариантов предустановочной информации (PI), транспортируемой из кодера, и пользовательской управляющей информации (UCI), содержащей предустановочную информацию (PI), выбранную пользователем, без регулировки пользователем усиления или панорамирования объекта.

Далее со ссылками на фиг.10 и т.п. подробно объясняются способ и устройство для обработки аудиосигнала с целью декодирования сигнала понижающего микширования (DMX), содержащего множество объектных сигналов, в случае если объектная информация (OI) от кодера не получена.

Прежде всего, заметим, что термин «скрытая информация (BI)» имеет тот же смысл, что и объектная информация (OI). Скрытая информация (BI) может содержать информацию об уровне и усилении объектного сигнала, содержащегося в сигнале понижающего микширования, так что декодер использует сигнал понижающего микширования (DMX), полученный от кодера, и может дополнительно содержать информацию о корреляции или метаинформацию. Процесс создания скрытой информации (BI) подробно объясняется ниже.

На фиг.10А и фиг.10В показаны схемы, реализующие способ обработки аудиосигнала для создания скрытой информации, с использованием информации о положении в выходном сигнале.

Обратимся к фиг.10А, где в случае использования устройства вывода, имеющего стереоканалы, слушатель получает аудиосигнал (DMX) из левого и правого каналов. Если аудиосигнал содержит множество объектных сигналов, каждый объектный сигнал может отличаться в пространственной области в соответствии с информацией об усилении, относящейся к левому или правому каналу.

На фиг.10В показана конфигурация сигнала, выводимого из каждого стереосигнала для создания единого объектного сигнала из числа объектных сигналов, различаемых в соответствии с областью их расположения. На фиг.10В объектный сигнал s показывает сигнал, идущий в направлении, определенном коэффициентом усиления a, в то время как независимые объектные сигналы n₁ и n₂показывают периферийные сигналы для сигнала s. Объектный сигнал может быть выведен в стереоканал со специальной информацией о направлении. Информация о направлении может содержать информацию о различии уровней, информацию о временном различии или т.п. Кроме того, конфигурация воспроизведения может определить периферийный сигнал, ширина полосы которого воспринимается на слух, или т.п. Выходной стереосигнал, показанный на фиг.10В, может быть представлен в виде формулы 1 с использованием объектного сигнала s, периферийных сигналов n₁ и n₂ и коэффициента a усиления для определения направления объектного сигнала.

Формула 1

Чтобы получить декомпозицию, пригодную не только для одного сценария акустических явлений, но и для случая нестационарного сигнала понижающего микширования (DMX), содержащего множество одновременно действующих активных источников, формулу 1 необходимо проанализировать независимым образом для нескольких частотных полос с привязкой ко времени. В этом случае x₁(n) и x₂(n) можно представить следующим образом.

Формула 2

где 'i'- индекс частотной полосы, а 'k'- индекс временного диапазона.

На фиг.11 показана схема частотно-временной области для анализа выходного стереосигнала согласно другому варианту настоящего изобретения. Каждая частотно-временная область включает в себя индекс I и индекс k. Объектный сигнал S, периферийные сигналы N₁ и N₂ и коэффициент А усиления могут оцениваться независимо. В последующем описании индекс I частотной полосы и индекса k временного диапазона должны игнорироваться следующим образом.

Ширину частотной полосы для анализа сигнала понижающего микширования (DMX) можно выбрать так, чтобы она была идентична конкретной полосе, и определить ее в соответствии с характеристиками сигнала понижающего микширования (DMX). Оценка S, N₁, N₂ и А в каждой частотной полосе может выполняться каждую миллисекунду t. В случае, когда в качестве сигналов понижающего микширования (DMX) заданы X₁ и X₂, оценочные значения S, N₁, N₂ и А можно определить путем анализа по каждой частотно-временной области. Кратковременную оценку А мощности Х₁ можно получить по формуле 3.

Формула 3

где Е{.}-операция усреднения на коротком отрезке времени.

Для других сигналов используют такой же подход, то есть соответствующими кратковременными оценками мощности являются PX2, PS и PN=PN1=PN2. Предполагается, что мощности N₁и N₂ одинаковы, то есть предполагается, что уровень мощности бокового независимого звука одинаков для левого и правого стереоканалов.

Используя указанное представление частотно-временных полос сигнала понижающего микширования (DMX), вычисляют мощность (P_X1, P_X2) и нормализованную взаимную корреляцию. Нормализованная взаимная корреляция между левым и правым каналами может быть представлена в виде формулы 4.

Формула 4

Информацию об усилении (А), мощность сигнала объекта (P_S) и мощность периферийного сигнала (P_N) вычисляют в функции оцененных значений P_X1, P_X2 и нормализованной взаимной корреляции (ϕ). Три уравнения, связывающих известные и неизвестные переменные, представлены в формуле 5.

Формула 5

Для А, P_S и P_N формула 5 преобразуется в формулу 6.

Формула 6

На фиг.12А и 12В представлены блок-схемы процесса создания скрытой информации (BI) из сигнала понижающего микширования (DMX), транспортируемого из кодера. Прежде всего, в часть 1210 для анализа набора фильтров вводятся сигналы (x₁(n), x₂(n)) понижающего микширования, имеющие стереоканалы, а затем они преобразуются в сигналы (x₁(i,k), x₂(i,k)) для каждой частотно-временной области [S1200]. Преобразованные сигналы (x₁(i,k), x₂(i,k)) понижающего микширования вводятся в часть 1220 для оценки информации об усилении. Часть 1220 для оценки информации об усилении анализирует преобразованные сигналы (x₁(i,k), x₂(i,k)) понижающего микширования, оценивает информацию об усилении (А) сигнала объекта [S1210] и определяет положение объектного сигнала в выходном сигнале понижающего микширования [S1220]. В этом случае оценочная информация (А) об усилении показывает вклад, который объектный сигнал, содержащийся в сигнале понижающего микширования, вносит в стереоканал выходного сигнала понижающего микширования, выбирает в качестве отдельного объектного сигнала сигнал из другого положения, в случае вывода сигнала понижающего микширования, и предполагает, что единый объектный сигнал имеет один вариант информации об усилении. Часть 1230 для оценки уровня объекта оценивает уровень (P_S) объектного сигнала, соответствующего каждому положению, с использованием информации о положении в информации об усилении (А), выведенной из части 1220 для оценки информации об усилении [S1230]. Часть 1240 для создания скрытой информации создает скрытую информацию (S_OLD) (BI) с использованием информации об усилении и уровня объектного сигнала [S1240].

Скрытая информация (BI) может кроме того содержать скрытую информацию (BCI) о корреляции и скрытую информацию (BGI) об усилении. Скрытая информация (DCI) о корреляции показывает корреляцию между объектами, причем она может быть создана с использованием оценочной информации об усилении и уровня объектного сигнала.

На фиг.13 представлена блок-схема устройства обработки аудиосигнала согласно одному варианту настоящего изобретения. Устройство 1300 обработки аудиосигнала согласно одному варианту настоящего изобретения содержит блок 1210 создания информации, блок 1220 обработки понижающего микширования и многоканальный декодер 1230. Блок 1220 обработки понижающего микширования и многоканальный декодер 1230 имеют такие же конфигурации и функции, как прежний блок 120 обработки понижающего микширования и многоканальный декодер 130, показанные на фиг.1. Поэтому далее их подробное описание их деталей опущено.

Обратимся к фиг.13, где блок 1210 создания информации получает от кодера сигнал понижающего микширования (DMX), объектную информацию (OI) и предустановочную информацию (PI), а затем созданную информацию (DPI) для обработки понижающего микширования и многоканальную информацию (MI). Блок 1210 создания информации включает в себя в основном часть 1211 для создания скрытой информации и часть 1212 для создания информации.

Если объектная информация (OI) передается из кодера, то часть 1211 для создания скрытой информации не создает скрытую информацию (BI), а, как упоминалось в предшествующем описании фиг.1, часть 1212 для создания информации создает информацию для обработки понижающего микширования и многоканальную информацию с использованием переданной объектной информации (OI).

Если объектная информация (OI) не передается в блок 1210 создания информации, как упоминалось в предшествующих описаниях фигур с 11 по 12В, часть 1211 создания скрытой информации получает сигнал понижающего микширования (DMX), преобразует его в сигналы (x₁(i,k), x₂(i,k)) для каждой частотно-временной области, распознает сигнал, находящийся в отдельном положении, в качестве единого объектного сигнала из преобразованного сигнала понижающего микширования, оценивает информацию об усилении (А) объектного сигнала, а затем создает скрытую информацию (BI, S_OLD) путем оценки уровня объектного сигнала с использованием информации об усилении (А).

На фиг.14 представлена подробная блок-схема блока 1210 создания информации, включая часть 1211 для создания скрытой информации.

Обратимся к фиг.14, где блок 1210 создания информации содержит в основном набор 1310 фильтров, часть 1320 для оценки скрытой информации и часть 1330 для создания информации. Набор 1310 фильтров преобразует сигнал понижающего микширования в сигналы для каждой частотно-временной области, чтобы получить возможность анализа для создания скрытой информации (BI). Сигнал понижающего микширования (DMX), преобразованный набором 1310 фильтров в сигналы (x₁(i,k), x₂(i,k)) для каждой частотно-временной области, вводится в часть 1320 для оценки скрытой информации. Скрытая информация (S_OLD) для декодирования сигнала понижающего микширования (DMX) создается с использованием информации о положении, информации об усилении (А) объектного сигнала и уровня (P_S) объектного сигнала. Между тем, часть 1330 для создания информации создает многоканальную информацию, используя скрытую информацию (BI) (S_OLD) и предустановочную информацию (PI).

На фиг.15 представлена схема интерфейса битового потока устройства обработки аудиосигнала, включая блок создания информации, показанной на фиг.14. Согласно одному варианту настоящего изобретения битовый поток, введенный в декодер 1510, содержит сигнал понижающего микширования (DMX), предустановочную информацию (PI) и пользовательскую управляющую информацию (UCI). В этом случае пользовательская управляющая информация (UCI) может представлять собой пользовательскую предустановочную информацию (UPI), используемую вместо неиспользуемой предустановочной информации (PI), поступающей от кодера, или может соответствовать управляющей информации (UCI) для частичной модификации предустановочной информации (PI). Объектный сигнал (OI) сюда не вводится. Часть для создания скрытой информации (на чертеже не показана) входит в состав декодера 1510. Битовый поток, выводимый из декодера, может содержать многоканальный сигнал (MI) и скрытую информацию (BI). Скрытая информация (BI) выводится из декодера 1510 и отдельно запоминается в памяти 1520 для многократного использования.

На фиг.16 представлена блок-схема устройства 1600 обработки аудиосигнала согласно еще одному варианту настоящего изобретения.

Обратимся к фиг.16, где устройство 1600 обработки аудиосигнала согласно настоящему изобретению включает в себя блок 1610 создания информации, пользовательский интерфейс 1620, блок 1630 обработки понижающего микширования и многоканальный декодер 1640.

Блок 1610 создания информации содержит часть 1512 для создания скрытой информации, часть 1614 для приема/передачи информации и часть 1616 для создания информации. В случае неполучения объектной информации (OI) от кодера часть 1612 создания скрытой информации создает скрытую информацию (BI), используя сигнал понижающего микширования (DMX). Между тем, часть 1614 для приема/передачи информации получает скрытую информацию (BI) или объектную информацию (OI) и получает пользовательскую управляющую информацию (UCI) от пользовательского интерфейса 1620, а предустановочную информацию (PI) от кодера. Часть 1616 создания информации создает многоканальную информацию (MI) и информацию (DPI) для обработки понижающего микширования, используя предустановочную информацию (PI), пользовательскую управляющую информацию (UCI) и скрытую информацию (BI) (или объектную информацию (OI)), полученную от блока 1614 приема/передачи информации.

Блок 1630 обработки понижающего микширования создает обработанный сигнал понижающего микширования (PDMX), используя сигнал понижающего микширования (DMX), полученный от кодера, и информацию (DPI) об обработке понижающего микширования, полученную от блока создания информации. Затем многоканальный декодер 1640 создает многоканальные сигналы канал_1, канал_2,… и канал_n, используя обработанный сигнал понижающего микширования (PDMX) и многоканальную информацию (MI).

Соответственно, способ и устройство обработки аудиосигнала согласно другому варианту настоящего изобретения создают скрытую информацию (BI), несмотря на неполучение объектной информации (OI) от кодера, и помогают облегчить регулировку усиления и панорамирование объектного сигнала в различных режимах, использующих предустановочную информацию (PI).

Хотя настоящее изобретение было здесь описано и проиллюстрировано со ссылками на предпочтительные варианты его осуществления, специалистам в данной области техники очевидно, что могут быть предложены различные модификации и вариации, не выходящие за рамки существа и объема изобретения. Таким образом, предполагается, что настоящее изобретение покрывает указанные модификации и вариации, которые не выходят за рамки объема прилагаемой формулы изобретения и ее эквивалентов.

Промышленная применимость

Соответственно, настоящее изобретение применимо к процессу кодирования/декодирования аудиосигнала.

1. Способ обработки аудиосигнала, содержащий этапы, на которых:
принимают сигнал понижающего микширования и битовый поток, включающий объектную информацию и предустановочную информацию;
создают информацию для обработки понижающего микширования с использованием объектной информации и предустановочной информации;
обрабатывают сигнал понижающего микширования с использованием информации об обработке понижающего микширования;
создают многоканальную информацию с использованием объектной информации и предустановочной информации,
в котором объектная информация содержит информацию об объектном уровне, информацию об объектной корреляции и информацию об объектном усилении, где информацию об объектном уровне создают путем нормализации объектного уровня, соответствующего объекту, с использованием одного из объектных уровней, где информацию об объектной корреляции создают из комбинации двух выбранных объектов, где информация об объектном усилении предназначена для определения вклада объекта для канала каждого сигнала понижающего микширования для создания сигнала понижающего микширования, и где предустановочную информацию извлекают из указанного битового потока.

2. Способ по п.1, в котором предустановочную информацию извлекают из битового потока отдельно от по меньшей мере одного, выбранного из группы, состоящей из сигнала понижающего микширования и объектной информации.

3. Способ по п.1, в котором предустановочная информация содержит коэффициент усиления по каждому объекту.

4. Способ по п.3, в котором коэффициент усиления изменяется во времени.

5. Способ по п.3, в котором коэффициент усиления изменяется с частотой.

6. Способ по п.3, в котором предустановочная информация содержит информацию о начальной точке, коэффициент усиления в начальной точке, информацию о конечной точке и коэффициент усиления в конечной точке.

7. Способ по п.1, дополнительно содержащий прием пользовательской управляющей информации для модификации или выбора предустановочной информации.

8. Способ по п.7, в котором пользовательская управляющая информация указывает, какую предустановочную информацию использовать.

9. Способ обработки аудиосигнала, содержащий этапы, на которых:
принимают сигнал понижающего микширования, объектную информацию и пользовательскую предустановочную информацию от пользователя;
создают информацию для обработки понижающего микширования с использованием объектной информации и пользовательской предустановочной информации;
обрабатывают сигнал понижающего микширования с использованием информации об обработке понижающего микширования;
создают многоканальную информацию с использованием объектной информации и пользовательской предустановочной информации,
в котором объектная информация содержит информацию об объектном уровне, информацию об объектной корреляции и информацию об объектном усилении, где информацию об объектном уровне создают путем нормализации объектного уровня, соответствующего объекту, с использованием одного из объектных уровней, где информацию об объектной корреляции создают из комбинации двух выбранных объектов, где информация об объектном усилении предназначена для определения вклада объекта для канала каждого сигнала понижающего микширования для создания сигнала понижающего микширования.

10. Способ по п.9, дополнительно содержащий этапы, на которых:
выводят предустановочную пользовательскую информацию; и запоминают предустановочную пользовательскую информацию.

11. Способ по п.7, дополнительно содержащий этапы, на которых:
создают модифицированную предустановочную информацию посредством приема пользовательской управляющей информации;
выводят модифицированную предустановочную информацию; и запоминают модифицированную предустановочную информацию.

12. Способ по п.11, в котором, если модифицированная предустановочная информация относится к частным объектам, предустановочную информацию об остальных объектах не модифицируют.

13. Способ по п.11, дополнительно содержащий этап, на котором:
отображают тот факт, что предустановочная информация модифицирована по объекту.

14. Способ по п.1, дополнительно содержащий, в случае существования по меньшей мере двух вариантов предустановочной информации, этап, на котором принимают информацию о выборе, где при создании многоканальной информации используют выбранную предустановочную информацию.

15. Способ по п.1, дополнительно содержащий этапы, на которых:
принимают метаинформацию, соответствующую предустановочной информации; и
отображают метаинформацию на пользовательском интерфейсе.

16. Способ по п.1, в котором сигнал понижающего микширования принимают через широковещательный сигнал.

17. Способ по п.1, в котором сигнал понижающего микширования принимают через цифровую среду.

18. Считываемый компьютером носитель записи, содержащий записанную на нем программу, причем программа обеспечена для выполнения этапов, описанных в п.1.

19. Устройство для обработки аудиосигнала, содержащее:
блок приема/передачи информации, принимающий сигнал понижающего микширования и битовый поток, включающий объектную информацию и предустановочную информацию;
блок создания информации для обработки понижающего микширования, создающий информацию об обработке понижающего микширования с использованием объектной информации и предустановочной информации;
блок обработки сигнала понижающего микширования, обрабатывающий сигнал понижающего микширования с использованием информации об обработке понижающего микширования; и
блок создания многоканальной информации, создающий многоканальную информацию с использованием объектной информации и предустановочной информации,
при этом объектная информация содержит информацию об объектном уровне, информацию об объектной корреляции и информацию об объектном усилении, где информацию об объектном уровне создают путем нормализации объектного уровня, соответствующего объекту, с использованием одного из объектных уровней, где информацию об объектной корреляции создают из комбинации двух выбранных объектов, где информация об объектном усилении предназначена для определения вклада объекта для канала каждого сигнала понижающего микширования для создания сигнала понижающего микширования, и где предустановочную информацию извлекают из указанного битового потока.

Изобретение относится к обработке речевых сигналов. .

Кодирование и декодирование звука // 2418385

Изобретение относится к кодированию и/или декодированию звука с использованием структур иерархического кодирования и/или структур иерархического декодирования. .

Поддиапазонный речевой кодекс с многокаскадными таблицами кодирования и избыточным кодированием // 2418324

Изобретение относится к аудиокодекам, в частности к поддиапазонному кодированию, таблицам кодирования и/или избыточному кодированию. .

Системы и способы для изменения окна с кадром, ассоциированным с аудио сигналом // 2418323

Изобретение относится к технологии обработки речевых сигналов, в частности система и способы относятся к изменению окна с кадром, ассоциированным с аудио сигналом.

Аудиокодер, аудиодекодер и аудиопроцессор, имеющий динамически изменяющуюся характеристику перекоса // 2418322

Изобретение относится к обработке аудиоданных с использованием фильтров с перекошенной характеристикой и, в частности, к многоцелевому кодированию аудиоданных. .

Способ и устройство для обработки аудиосигнала // 2417549

Изобретение относится к способу и устройству для декодирования аудиосигнала, принятого на цифровом носителе, например сигнала вещания. .

Способ и устройство для декодирования аудиосигнала // 2417459

Изобретение относится к способу и устройству для декодирования аудиосигнала, предназначено для обеспечения способа декодирования аудиосигнала посредством использования информации об объекте, включающей в себя информацию об уровне объекта и информацию о коэффициенте усиления объекта, для модифицирования сигнала понижающего смешивания аудиосигнала в виде изменения вклада объекта в каждый канал понижающего смешивания.

Генерирование многоканальных звуковых сигналов // 2417458

Изобретение относится к генерированию многоканальных звуковых сигналов из матрично-кодированного стереосигнала объемного звука. .

Способ конкатенации кадров в системе связи // 2417457

Изобретение относится к телекоммуникационным системам, в частности к способу и устройству конкатенации кадров в системе связи. .

Масштабируемое многоканальное кодирование звука // 2416129

Изобретение относится к области высококачественного кодирования звука. .

Способ кодирования широкополосного речевого сигнала // 2419169

Изобретение относится к системе электросвязи и предназначено для кодирования широкополосного речевого сигнала (ШРС) с диапазоном частот от 50 до 7000 Гц

Системы, способы и устройство для широкополосного кодирования и декодирования активных кадров // 2419170

Изобретение относится к обработке речевых сигналов

Способ переключения скорости передачи битов при аудиодекодировании с масштабированием скорости передачи битов и масштабированием полосы пропускания // 2419171

Изобретение относится к способу переключения скорости передачи битов при декодировании аудиосигнала, кодированного с помощью системы аудиокодирования, причем упомянутое декодирование содержит этап последующей обработки, зависящий от скорости передачи битов

Способ и устройство эффективной маскировки стирания кадров в речевых кодеках // 2419891

Изобретение относится к способу цифрового кодирования звукового сигнала

Способы и устройства для кодирования и декодирования аудиосигналов на основе объектов // 2420026

Изобретение относится к декодированию аудиосигналов

Аудиодекодирование // 2420814

Изобретение относится к аудиодекодированию и в особенности к декодированию сигналов MPEG Surround

Устройство и способ для генерации значений подполос звукового сигнала и устройство и способ для генерации отсчетов звукового сигнала во временной области // 2420815

Изобретение относится к кодированию и декодированию звука

Способ двоичного кодирования показателей квантования огибающей сигнала, способ декодирования огибающей сигнала и соответствующие модули кодирования и декодирования // 2420816

Изобретение относится к способам передачи и хранения цифровых звуковых сигналов, в частности, к способам двоичного кодирования показателей квантования, определяющих огибающую сигнала

Системы и способы для включения идентификатора в пакет, ассоциативно связанный с речевым сигналом // 2421828

Изобретение относится к технологии обработки речи

Способ компрессии аудиоданных // 2421829

Изобретение относится к технике цифровой обработки сигналов и может быть использовано в системах сжатия звуковых сигналов