Неравномерное квантование параметров для усовершенствованной связи

Изобретение относится к звуковому кодированию, в частности оно относится к перцептивно оптимизированному квантованию параметров, используемых в системе для параметрического пространственного кодирования звуковых сигналов. Технический результат – повышение эффективности и качества кодирования звукового сигнала. Группа изобретений предусматривает неравномерное квантование параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, а также обеспечивает восстановление звукового сигнала в системе декодирования звука, учитывающей неравномерно квантованные параметры. Согласно изобретению такой подход делает возможным снижение битовых затрат без существенного снижения качества восстановленного звукового сигнала. 7 н. и 14 з.п. ф-лы, 7 ил., 4 табл.

 

Перекрестная ссылка на родственные заявки

Настоящая заявка заявляет приоритет предварительной заявки на патент США №61/877166, поданной 12 сентября 2013 года, описание которой полностью включено в настоящее описание посредством ссылки.

Область техники изобретения

Раскрытие, описанное в настоящем документе, относится, как правило, к звуковому кодированию. В частности, оно относится к перцептивно оптимизированному квантованию параметров, используемых в системе для параметрического пространственного кодирования звуковых сигналов.

Предпосылки создания изобретения

Производительность низкоскоростных систем кодирования звука может быть значительно улучшена для стереофонических сигналов при применении инструментального средства параметрического стереофонического (PS) кодирования. В такой системе монофонический сигнал, как правило, квантуется и передается с помощью аудиокодера современного технического уровня, и стереофонические параметры оцениваются и квантуются в кодере и добавляются в качестве дополнительной информации к битовому потоку. В декодере стереофонический сигнал восстанавливается из декодированного монофонического сигнала с помощью стереофонических параметров.

Существует несколько возможных вариантов параметрического стереофонического кодирования. Соответственно существует несколько типов кодеров и в дополнение к монофоническому понижающему микшированию они генерируют разные стереофонические параметры, которые встраиваются в генерируемый битовый поток. Инструментальные средства такого кодирования также были стандартизированы. Примером такого стандарта является MPEG-4 Audio (ISO/IEC 14496-3).

Основная идея создания систем кодирования звука, в целом, и параметрического стереофонического кодирования, в частности, и одна из нескольких задач данной области техники состоит в минимизации количества информации, которая должна быть передана в битовом потоке от кодера к декодеру с одновременным получением хорошего качества звука. Высокий уровень сжатия информации битового потока может привести к недопустимому качеству звука либо из-за сложных и неудовлетворительных вычислительных процессов, либо из-за того, что информация была утрачена в процессе сжатия. Низкий уровень сжатия информации битового потока, с другой стороны, может привести к проблемам емкости, которые также могут привести к недопустимому качеству звука.

Соответственно существует потребность в улучшенных способах параметрического стереофонического кодирования.

Краткое описание графических материалов

В дальнейшем будут описаны более подробно примерные варианты осуществления со ссылками на прилагаемый графический материал на котором:

фиг. 1 раскрывает блок-схему системы параметрического стереофонического кодирования и декодирования в соответствии с примерным вариантом осуществления;

на фиг. 2 показана блок-схема, относящаяся к обработке стереофонических параметров в кодирующей части системы параметрического стереофонического кодирования, показанной на фиг. 1;

на фиг. 3 показана блок-схема, относящаяся к обработке стереофонических параметров в декодирующей части системы параметрического стереофонического кодирования, показанной на фиг. 1;

на фиг. 4 показано значение коэффициента масштабирования в зависимости от одного из стереофонических параметров;

фиг. 5 раскрывает неравномерные и равномерные квантователи (точные и грубые) в плоскости (а, b), где а и b - стереофонические параметры; и

на фиг. 6 представлена диаграмма, показывающая средние параметрические стереофонические битовые затраты для примеров равномерного точного и равномерного грубого квантования в сравнении с неравномерным точным и неравномерным грубым квантованием согласно примерного варианта осуществления;

фиг. 7 раскрывает блок-схему системы параметрического многоканального кодирования и декодирования в соответствии с другим примерным вариантом осуществления.

Все чертежи являются схематическими и, как правило, показывают лишь те части, которые необходимы для разъяснения изобретения; другие части могут быть опущены или просто подразумеваться. Если не указано иное, подобные части на разных чертежах обозначены подобными позициями.

Подробное описание

Ввиду сказанного выше, цель изобретения заключается в том, чтобы предложить кодеры, декодеры, системы, содержащие кодеры и декодеры и связанные с ними методы, которые обеспечивают повышенную эффективность и качество кодированного звукового сигнала.

I. Обзор - Кодер

Согласно первому аспекту примерные варианты осуществления предлагают способы кодирования, кодирующие устройства и компьютерные продукты для кодирования. Предлагаемые способы, кодирующие устройства и компьютерные программные продукты могут, как правило, иметь одни и те же признаки и преимущества.

Согласно примерным вариантам осуществления предусмотрен способ для квантования в аудиокодере параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, включающий: прием по меньшей мере первого параметра и второго параметра для квантования; квантование первого параметра на основе первой схемы скалярного квантования, имеющей неравномерные размеры шага, для получения первого квантованного параметра, причем неравномерные размеры шага выбираются таким образом, что меньшие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным; деквантизацию квантованного первого параметра с использованием первой схемы скалярного квантования для получения деквантованного первого параметра, являющегося приближенным представлением первого параметра; обращение к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определение коэффициента масштабирования посредством подвергания деквантованного первого параметра действию функции масштабирования; и квантование второго параметра на основе коэффициента масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения квантованного второго параметра.

Способ основан на понимании того, что человеческое восприятие звука не однородно. Вместо этого оказывается, что восприятие человеком звука выше в отношении некоторых звуковых характеристик и ниже для других звуковых характеристик. Это означает, что человеческое восприятие звука является более чувствительным для некоторых значений параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, чем для других таких значений. Согласно предложенному способу первый такой параметр квантуется с неравномерными размерами шага таким образом, что меньшие размеры шага используются там, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются там, где человеческое восприятие звука является менее чувствительным. Посредством квантования с использованием таких схем с неравномерными размерами шага можно снизить средние параметрические стереофонические битовые затраты без заметного уменьшения качества звука.

Согласно вариантам осуществления функция масштабирования согласно данному способу является кусочно-линейной функцией.

Согласно вариантам осуществления этап квантования второго параметра согласно способу основан на коэффициенте масштабирования, и вторая схема скалярного квантования включает деление второго параметра на коэффициент масштабирования до подвергания второго параметра квантованию в соответствии со второй схемой скалярного квантования.

Согласно альтернативному варианту осуществления способа неравномерные размеры шага второй схемы скалярного квантования масштабируют коэффициентом масштабирования до квантования второго параметра.

Согласно вариантам осуществления способа неравномерные размеры шага второй схемы скалярного квантования увеличивают со значением второго параметра.

Согласно вариантам осуществления способа первая схема скалярного квантования включает больше этапов квантования, чем вторая схема скалярного квантования.

Согласно вариантам осуществления способа первая схема скалярного квантования строится посредством сдвига, зеркального отображения и конкатенации второй схемы скалярного квантования.

Согласно вариантам осуществления способа наибольший размер шага первой и/или второй схемы скалярного квантования приблизительно в четыре раза больше наименьшего размера шага первой и/или второй схемы скалярного квантования.

Согласно примерным вариантам осуществления предлагается машиночитаемый носитель, содержащий команды машинного кода, предназначенные для выполнения любого способа согласно первому аспекту при выполнении на устройстве, имеющем возможность обработки.

Согласно примерным вариантам осуществления предусмотрен аудиокодер для квантования параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, содержащий: принимающий компонент, выполненный с возможностью приема по меньшей мере первого параметра и второго параметра для квантования; первый компонент квантования, расположенный ниже по потоку от принимающего компонента, выполненный с возможностью квантования первого параметра на основе первой схемы скалярного квантования, имеющей неравномерные размеры шага, для получения квантованного первого параметра, причем неравномерные размеры шага выбираются таким образом, что меньшие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным; компонент деквантования, выполненный с возможностью приема первого квантованного параметра от первого компонента квантования и деквантования квантованного первого параметра с использованием первой схемы скалярного квантования для получения деквантованного первого параметра, являющегося приближенным представлением первого параметра; компонент определения коэффициента масштабирования, выполненный с возможностью приема деквантованного первого параметра, обращения к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определения коэффициента масштабирования посредством подвергания деквантованного первого параметра воздействию функции масштабирования; и второй компонент квантования, выполненный с возможностью приема второго параметра и коэффициента масштабирования и квантования второго параметра на основе коэффициента масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения квантованного второго параметра.

II. Обзор - Декодер

Согласно второму аспекту примерные варианты осуществления предлагают способы декодирования, декодирующие устройства и компьютерные программные продукты для декодирования. Предлагаемые способы, декодирующие устройства и компьютерные программные продукты могут, как правило, иметь одни и те же признаки и преимущества.

Преимущества, касающиеся признаков и устройств, представленных в обзоре кодирующего устройства выше, могут, как правило, распространяться и на соответствующие признаки и устройства для декодирующего устройства.

Согласно примерным вариантам осуществления предусмотрен способ в аудиодекодере для деквантования квантованных параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, включающий: прием по меньшей мере первого квантованного параметра и второго квантованного параметра; деквантование квантованного первого параметра в соответствии с первой схемой скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного первого параметра, причем неравномерные размеры шага выбираются таким образом, что меньшие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным; обращение к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определение коэффициента масштабирования посредством подвергания деквантованного первого параметра воздействию функции масштабирования; и деквантование второго квантованного параметра на основе функции масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного второго параметра.

Согласно вариантам осуществления способа функция масштабирования является кусочно-линейной функцией.

Согласно варианту осуществления этап деквантования второго параметра на основе коэффициента масштабирования и второй схемы скалярного квантования включает деквантование второго квантованного параметра в соответствии со второй схемой скалярного квантования и умножение его результата на коэффициент масштабирования.

Согласно альтернативному варианту осуществления неравномерные размеры шага второй схемы скалярного квантования масштабируются коэффициентом масштабирования до деквантования второго квантованного параметра.

Согласно дополнительным вариантам осуществления неравномерный размер шага второй схемы скалярного квантования возрастает со значением второго параметра.

Согласно варианту осуществления первая схема скалярного квантования включает больше этапов квантования, чем вторая схема скалярного квантования.

Согласно варианту осуществления первая схема скалярного квантования строится посредством сдвига, зеркального отображения и конкатенации второй схемы скалярного квантования.

Согласно варианту осуществления наибольший размер шага первой и/или второй схемы скалярного квантования приблизительно в четыре раза больше наименьшего размера шага первой и/или второй схемы скалярного квантования.

Согласно примерным вариантам осуществления предлагается машиночитаемый носитель, содержащий команды машинного кода, предназначенные для выполнения способа любого способа согласно второму аспекту при выполнении посредством устройства, имеющего возможность обработки.

Согласно примерным вариантам осуществления предусмотрен аудиодекодер для деквантования квантованных параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, содержащий: принимающий компонент, выполненный с возможностью приема по меньшей мере первого квантованного параметра и второго квантованного параметра; первый компонент деквантования, расположенный ниже по потоку от принимающего компонента и выполненный с возможностью деквантования квантованного первого параметра в соответствии с первой схемой скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного первого параметра, причем неравномерные размеры шага выбираются таким образом, что меньшие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным; компонент определения коэффициента масштабирования, выполненный с возможностью приема деквантованного первого параметра от первого компонента деквантования, доступа к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определения коэффициента, масштабирования посредством подвергания деквантованного первого параметра действию функции масштабирования; и второй компонент деквантования, выполненный с возможностью приема коэффициента масштабирования и второго квантованного параметра и деквантования второго квантованного параметра на основе коэффициента масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного второго параметра.

III. Обзор - Система кодирования/декодирования звука

Согласно третьему аспекту примерные варианты осуществления предлагают системы декодирования/кодирования, содержащие кодер согласно первому аспекту и декодер согласно второму аспекту.

Преимущества, касающиеся признаков и устройств, представленных в обзоре кодирующего устройства и декодирующего устройства выше, могут, как правило, распространяться и на соответствующие признаки и устройства для системы.

Согласно вариантам осуществления предлагается такая система, в которой аудиокодер выполнен с возможностью передачи первого и второго квантованных параметров в аудиодекодер.

IV. Примерные варианты осуществления

Раскрытие в данном описании рассматривает перцептивно оптимизированное квантование параметров, используемых в системе для параметрического пространственного кодирования звуковых сигналов. В рассмотренных ниже примерах изложен частный случай параметрического стереофонического кодирования для 2-канальных сигналов. Такой же метод может быть также использован в параметрическом многоканальном кодировании, например, в системе, работающей в режиме 5-3-5. Примерный вариант осуществления такой системы схематически представлен на фиг. 7 и будет кратко рассмотрен ниже. Примерные варианты осуществления, представленные в данной заявке, относятся к простому неравномерному квантованию, обеспечивающему уменьшение битовой скорости передачи данных, необходимой для передачи данных параметров без влияния на качество воспринимаемого звука, и к тому же обеспечивающему продолжающееся использование установившихся методов энтропийного кодирования для скалярных параметров (например, временного или частотного дифференциального кодирования с последующим кодированием методом Хаффмана).

На фиг. 1 показана блок-схема варианта осуществления системы 100 параметрического стереофонического кодирования и декодирования, рассмотренная в данной заявке. Стереофонический сигнал, содержащий левый канал 101 (L) и правый канал 102 (R) принимается кодирующей частью 110 системы 100. Стереофонический сигнал посылается в качестве входного на кодер 112 с "Усовершенствованной связью" (ACPL), генерирующий монофоническое понижающее микширование 103 (М) и стереофонические параметры а (обозначенный на фиг. 1 как 104а) и b (обозначенный на фиг. 1 как 104b). Кроме того, кодирующая часть 110 содержит кодер 114 понижающего микширования (DMX Enc), преобразующий монофоническое понижающее микширование 103 в битовый поток 105, устройство 116 квантования стереофонических параметров (Q), генерирующее поток квантованных стереофонических параметров 106, и мультиплексор 118 (MUX), который генерирует окончательный битовый поток 108, который также содержит квантованные стереофонические параметры, которые предаются в декодирующую часть 120. Декодирующая часть 120 содержит демультиплексор 122 (DE-MUX), который принимает входящий окончательный битовый поток 108 и регенерирует битовый поток 105 и поток квантованных стереофонических параметров 106, декодер 124 понижающего микширования (DMX Dec), который принимает битовый поток 105 и выводит декодированное монофоническое понижающее микширование 103' (М'), устройство 126 деквантования стереофонических параметров (Q'), которое принимает поток квантованных стереофонических параметров 106 и выводит деквантованные стереофонические параметры а' 104а' и b' 104b', и наконец декодер 128 ACPL, который принимает декодированное монофоническое понижающее микширование 103' и деквантованные стереофонические параметры 104а', 104b' и преобразует эти входящие сигналы в восстановленные стереофонический сигналы 101' (L') и 102' (R').

Исходя из входных стереофонический сигналов 101 (L) и 102 (R), декодер 112 ACPL вычисляет монофоническое понижающее микширование 103 (М) и дополнительный сигнал (S) в соответствии со следующими уравнениями:

Стереофонические параметры а и b вычисляются время- и частотно-избирательным способом, т.е. для каждого частотно-временного элемента покрытия, как правило, с помощью блока фильтров, как блок QMF, и с использованием неравномерного группирования диапазонов QMF для формирования множества диапазонов параметров согласно перцептивной шкале частот.

В декодере ACPL декодированное монофоническое микширование М' вместе со стереофоническими параметрами а', b' и декоррелированной версией М' (decorr (М')) используются в качестве входного сигнала для восстановления приближенного представления дополнительного сигнала в соответствии со следующим уравнением:

Затем L' и R' вычисляются следующим образом:

Пара параметров (а, b) может рассматриваться как точка на двумерной плоскости (а, b). Параметры a, b связаны с воспринимаемым стереофоническим образом, где параметр а, в первую очередь, связан с положением воспринимаемого источника звука (например, слева или справа), и где параметр b, в первую очередь, связан с размером или шириной воспринимаемого источника звука (небольшой и хорошо локализованный или широкий и окружающий). В таблице 1 приведены несколько типичных примеров воспринимаемых стереофонических образов и соответствующие значения параметров а, b.

Необходимо отметить, что b не бывает отрицательным. Следует также отметить, что несмотря на то, что b и абсолютное значение а часто находятся в пределах от 0 до 1, они также могут иметь абсолютные значения больше чем 1, например, в случае сильно не совпадающих по фазе компонентов в L и R, то есть, когда корреляция между L и R является отрицательной.

В данный момент текущей проблемой является разработка метода квантования параметров a, b для передачи в качестве дополнительной информации в системе параметрического стереофонического/пространственного кодирования. Простым и непосредственным подходом известного уровня техники является использование равномерного квантования и независимое квантование а и b, т.е. с использованием двух скалярных квантователей. Типичный размер шага квантования дельта = 0,1 для точного или дельта = 0,2 для грубого квантования. На нижних левой и правой панелях фиг. 5 показаны точки на плоскости (а, b), которые могут быть представлены посредством такой схемы квантования для точного и грубого квантования. Как правило, квантованные параметры а и b независимо энтропийно кодируются с использованием временного дифференциального или частотного дифференциального кодирования в сочетании с кодированием методом Хаффмана.

Тем не менее к текущему моменту авторы изобретения установили, что эффективность (в смысле уровня искажений) параметра квантования может быть улучшена касаемо такого скалярного квантования посредством принятия во внимание аспектов, относящиеся к восприятию. В частности, чувствительность человеческой слуховой системы к малым изменениям значений параметров (как погрешность, вносимая квантованием) зависит от положения на плоскости (а, b). Эксперименты по восприятию, исследующие слышимость таких небольших изменений или "еле заметных отличий" (JND) показывают, что JND для а и b существенно меньше для источников звука с воспринимаемым стереофоническим образом, который представлен в точках (1, 0) и (-1, 0) на плоскости (а, b). Следовательно, равномерное квантование а и b может быть слишком грубым (со слышимыми артефактами) для областей, близких к (1, 0) и (-1, 0) и излишне точным (из-за излишне высокой битовой скорости передачи дополнительной информации) в других областях, таких как вблизи (0, 0) и (0, 1). Конечно, возможно учесть вектор квантования для (а, b) для достижения совместного и неравномерного квантования стереофонических параметров а и b. Тем не менее векторное квантования является вычислительно более сложным, а также (временное или частотно-дифференциальное) энтропийное кодирование должно быть адаптировано, и оно также станет более сложным.

Соответственно, в данной заявке представлена новая схема неравномерного квантования для параметров а и b. Схема неравномерного квантования для а и b применяет позиционно-зависимые JND (как могла бы применять векторное квантование), но она может быть реализована в виде небольшой модификации известного уровня техники равномерного и независимого квантования а и b. Кроме того, известный уровень техники временного или частотного дифференциального энтропийного кодирования также может оставаться практически неизменным. Только книги с кодом Хаффмана должны быть обновлены, чтобы отразить изменения в диапазонах индексов и вероятностях символов.

Полученная схема квантования показана на фиг. 2 и 3, где фиг. 2 соответствует устройству 116 квантования стереофонических параметров кодирующей части 110, а фиг. 3 соответствует устройству 126 деквантования стереофонических параметров декодирующей части 120. Схема квантования стереофонических параметров начинает с применения неравномерного скалярного квантования к параметру а (обозначенному как 104а на фиг. 2) в устройстве квантования Qa (обозначенному как 202 на фиг. 2). Квантованный параметр 106а направляется в мультиплексор 118. Квантованный параметр также деквантуется непосредственно в устройстве деквантования Qa-1 (обозначенном как 204 на фиг. 2) в параметр а'. Так как квантованный параметр 106а деквантуется в а' (обозначенный как 104а' на фиг. 3), в декодирующей части 120, а' также будет идентичен как в кодирующей части 110, так и в декодирующей части 120 системы 100. Затем а' используется для вычисления коэффициента масштабирования s (осуществляется устройством 206 масштабирования), который используется, чтобы выполнить квантование b в зависимости от фактического значения а. Параметр b (обозначенный как 104b на фиг. 2) делится на этот коэффициент масштабирования s (осуществляется устройством 208 вычисления обратной величины и устройством 210 умножения), а затем посылается в другой неравномерной скалярный квантователь Qb (обозначенный как 212 на фиг. 2), из которого передается квантованный параметр 106b. Процесс является частично обратным в устройстве 126 квантования стереофонического параметра, показанном на фиг. 3. Входящие квантованные параметры 106а и 106b деквантуются в устройстве деквантования Qa-1 (обозначенном на фиг. 3 как 304) и Qb-1 (обозначенном на фиг. 3 как 308) в а' (обозначенный как 104а' на фиг. 3) и b', предварительно разделенный на коэффициент масштабирования s в кодирующей части 110. Устройство 306 масштабирования определяет коэффициент масштабирования s на основе деквантованного параметра а' (104а) таким же образом, как устройство 206 масштабирования в кодирующей части 110. Затем коэффициент масштабирования умножается на результат деквантования квантованного параметра 106b в устройстве 310 умножения и получается деквантованный параметр b' (обозначенный 104b' на фиг. 3). Соответственно деквантование а и вычисление коэффициента масштабирования реализуется как в кодирующей части 110, так и в декодирующей части 120, с обеспечением того, что то же самое значение s используется для кодирования и декодирования b.

Неравномерное квантование для а и b основывается на простом неравномерном квантователе для значений в диапазоне от 0 до 1, где размер шага квантования для значений около 1 приблизительно в четыре раза больше, чем размер шага квантования для значений около 0, и где размер шага квантования возрастает со значением параметра. Например, размер шага квантования может возрастать приблизительно линейно с индексом, определяющим соответствующее деквантованное значение. Для квантователя с 8 интервалами (т.е. 9 индексами) могут быть получены следующие значения, когда размер шага квантования является разницей между двумя соседними деквантованными значениями.

Данная таблица является примером схемы квантования, которая может быть использована для устройства деквантования Qb-1 (обозначенного как 308 на фиг. 3). Однако для параметра а должен быть обработан больший диапазон значений. Пример схемы квантования для устройства деквантования Qa-1 (обозначенным как 304 на фиг. 3) может быть просто построен посредством зеркального отображения и конкатенации неравномерных интервалов квантования, показанных в таблице 2 выше, с получением квантователя, который может представлять значения в диапазоне от -2 до 2, где размер шага квантования для значений около -2, 0 и 2 приблизительно в четыре раза больше размера шага квантования для значений около -1 и 1. Полученные значения приведены в таблице 3 ниже.

На фиг. 4 показано значение коэффициента масштабирования в зависимости от а. Это кусочно-линейная функция при s = 1 (т.е. без масштабирования) для а = -1 и а = 1 и при s = 4 (4-кратном грубом квантовании b) для а = -2, а = 0 и а = 2. Следует указать, что функция на фиг. 4 является примером, и что теоретически возможны другие такие функции. Такое же рассуждение применимо к схемам квантования.

Полученное неравномерное квантование а и b показано на верхней левой панели фиг. 5, где каждая точка на плоскости (а, b), которая может быть представлена данным квантователем, отмечена крестом. Около наиболее чувствительных точек (1, 0) и (-1, 0) размер шага квантования как для а, так для b составляет приблизительно 0,06, в то время как он составляет приблизительно 0,2 для а и b около (0, 0). Следовательно, этапы квантования гораздо более адаптированы к JND, чем равномерное скалярное квантование а и b.

Если необходимо грубое квантование, то можно просто удалить каждое второе деквантованное значение неравномерных квантователей, тем самым удвоив размер шага квантования. В таблице 4 показано, что следующие грубые неравномерные квантователи для параметра b и неравномерные квантователи для параметра а получаются аналогично тому, что было показано выше.

Функция масштабирования, показанная на фиг. 4, остается неизменной во время грубого квантования, и полученный грубый квантователь для (а, b) показан на верхней правой панели фиг. 5. Такое грубое квантование может быть необходимым, если система кодирования работает при очень низких целевых битовых скоростях передачи данных, где оно может быть выгодным для использования битов, сохраненных посредством грубого квантования стереофонических параметров, для кодирования вместо понижающего микширования монофонического сигнала М (обозначенного как 103 на фиг. 1).

Различия в эффективности неравномерного и равномерного квантования стереофонических параметров а и b показана на фиг. 6. Различия показаны для точного и грубого квантования. Показаны средние битовые затраты в секунду, соответствующие 11 часам музыки. Из фиг. 6 можно сделать вывод, что битовые затраты для неравномерного квантования существенно ниже, чем для равномерного квантования. Кроме того, можно сделать вывод, что грубое неравномерное квантование снижает битовые затраты в секунду больше, чем грубое равномерное квантование.

В заключение, блок-схема примерного варианта осуществления системы 700 параметрического многоканального кодирования и декодирования 5-3-5 раскрыта на фиг. 7. Многоканальный сигнал, содержащий левый передний канал 701, левый окружающий канал 702, центральный передний канал 703, правый передний канал 704 и правый окружающий канал 705, получен посредством кодирующей части 710 системы 700. Сигналы левого переднего канала 701 и левого окружающего канала 702 посылаются в качестве входных на первый кодер 712 с "Усовершенствованной связью" (ACPL), генерирующий левое понижающее микширование 706 и стереофонические параметры aL (обозначенные как 708а) и bL (обозначенные как 708b). Аналогичным образом сигналы правого переднего канала 704 и правого окружающего канала 705 посылаются в качестве входных на второй кодер 713 с "Усовершенствованной связью" (ACPL), генерирующий правое понижающее микширование 707 и стереофонические параметры aR (обозначенные как 709а) и bR (обозначенные как 709b). Кроме того, кодирующая часть 710 содержит 3-канальный кодер 714 понижающего микширования, преобразующий сигналы левого понижающего микширования 706, центрального переднего канала 703 и правого понижающего микширования 707 в битовый поток 722, первое устройство 715 квантования стереофонических параметров, генерирующее первый поток квантованных стереофонических параметров 720 на основе стереофонических параметров 708а и 708b, второе устройство 716 квантования стереофонических параметров, генерирующее второй поток квантованных стереофонических параметров 724 на основе стереофонических параметров 709а и 709b, и мультиплексор 730, который генерирует окончательный битовый поток 735, который также включает квантованные стереофонические параметры, которые передаются в декодирующую часть 740. Декодирующая часть 740 содержит демультиплексор 742, который принимает входящий окончательный битовый поток 735 и регенерирует битовый поток 722, первый поток квантованных стереофонических параметров 720 и второй поток квантованных стереофонических параметров 724. Первый поток квантованных стереофонических параметров 720 принимается первым устройством 745 деквантования стереофонических параметров, которое выводит деквантованные стереофонические параметры 708а' и 708b'. Второй поток квантованных стереофонических параметров 724 принимается вторым устройством 746 деквантования стереофонических параметров, которое выводит деквантованные стереофонические параметры 709а' и 709b'. Битовый поток 722 принимается 3-канальным декодером 744 понижающего микширования, который выводит регенерированное левое понижающее микширование 706', восстановленный центральный передний канал 703' и регенерированное правое микширование 707'. Первый декодер 747 ACPL принимает деквантованные стереофонические параметры 708а' и 708b', а также регенерированное левое понижающее микширование 706' и выходные сигналы восстановленного левого переднего канала 701 и восстановленного левого окружающего канала 702'. Аналогичным образом второй декодер 748 ACPL принимает деквантованные стереофонические параметры 709а', 709b' и регенерированное правое понижающее микширование 707' и выходные сигналы восстановленного правого переднего канала 704' и восстановленного правого окружающего канала 705'.

Эквиваленты, дополнения, альтернативы и прочее

Дополнительные варианты осуществления раскрытия будут очевидны. для специалиста в данной области техники после изучения описания, приведенного выше. Несмотря на то, что настоящее описание и графические материалы раскрывают варианты осуществления и примеры, раскрытие не ограничивается данными конкретными примерами. Возможны многочисленные модификации и изменения в пределах объема настоящего раскрытия, определенного прилагаемой формулой изобретения. Любые ссылочные позиции, встречающиеся в формуле изобретения, не должны рассматриваться как ограничивающие ее объем.

Кроме того, после изучения графических материалов, описания и прилагаемой формулы изобретения специалисту могут быть понятными изменения раскрытых вариантов осуществления и могут использоваться им при практической реализации раскрытия. В формуле изобретения слово «содержащий» не исключает другие элементы или этапы, и единственное число не исключает множественное. Сам факт, что некоторые признаки упоминаются во взаимно отличных зависимых пунктах формулы изобретения, не говорит о том, что не может быть использована с выгодой комбинация этих признаков.

Системы и способы, раскрытые выше, могут быть осуществлены в виде программного обеспечения, программно-аппаратного обеспечения, аппаратного обеспечения или их комбинации. При осуществлении в виде аппаратного обеспечения разделение задач между функциональными узлами, о которых говорилось в вышеприведенном описании, не обязательно соответствует разделению на физические узлы; наоборот, один физический компонент может выполнять несколько функций, а одно задание может выполняться несколькими физическими компонентами во взаимодействии. Некоторые компоненты или все компоненты могут быть осуществлены в виде программного обеспечения, выполняемого процессором цифровых сигналов или микропроцессором, или быть осуществлены в виде аппаратного обеспечения или в виде зависимой от приложения интегральной микросхемы. Такое программное обеспечение может распространяться на машиночитаемых носителях, которые могут содержать компьютерные носители данных (или постоянные носители) и средства коммуникации (или временные носители). Как хорошо известно специалисту в области техники, термин «компьютерные носители данных» включает энергозависимые и энергонезависимые, съемные и несъемные носители, реализованные любым способом или технологией для хранения информации, такой как машиночитаемые команды, структуры данных, программные модули или другие данные. Компьютерные носители данных включают, кроме прочего, ОЗУ, ПЗУ, ЭСППЗУ, флеш-память или другую технологию памяти, компакт-диски, компакт-диски формата DVD или другие оптические диски для хранения информации, магнитные кассеты, магнитную ленту, магнитный диск для хранения информации или другие магнитные дисковые устройства хранения информации, или любой другой носитель, который может быть использован для хранения желаемой информации, и который может быть доступным с помощью компьютера. Кроме того, специалисту хорошо известно, что в средствах коммуникации, как правило, выполняются машиночитаемые команды, структуры данных, программные модули или другие данные в виде модулированного сигнала данных, такого как несущая волна или другой механизм переноса, и содержатся любые средства для доставки информации.

1. Способ в аудиокодере для квантования параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, включающий:

прием по меньшей мере первого параметра и второго параметра для квантования;

квантование первого параметра на основе первой схемы скалярного квантования, имеющей неравномерные размеры шага, для получения квантованного первого параметра, причем неравномерные размеры шага выбирают таким образом, что меньшие размеры шага используют для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используют для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным;

деквантование квантованного первого параметра с использованием первой схемы скалярного квантования для получения деквантованного первого параметра, являющегося приближенным представлением первого параметра;

обращение к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определение коэффициента масштабирования посредством подвергания деквантованного первого параметра действию функции масштабирования; и

квантование второго параметра на основе коэффициента масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения квантованного второго параметра.

2. Способ по п. 1, отличающийся тем, что функция масштабирования является кусочно-линейной функцией.

3. Способ по п. 1, отличающийся тем, что этап квантования второго параметра на основе коэффициента масштабирования и второй схемы скалярного квантования включает деление второго параметра на коэффициент масштабирования до подвергания второго параметра квантованию в соответствии со второй схемой скалярного квантования.

4. Способ по п. 1, отличающийся тем, что неравномерные размеры шага второй схемы скалярного квантования масштабируют коэффициентом масштабирования до квантования второго параметра.

5. Способ по п. 1, отличающийся тем, что неравномерные размеры шага второй схемы скалярного квантования возрастают со значением второго параметра.

6. Способ по п. 1, отличающийся тем, что первая схема скалярного квантования включает больше этапов квантования, чем вторая схема скалярного квантования.

7. Способ по п. 1, отличающийся тем, что первую схему скалярного квантования строят посредством сдвига, зеркального отображения и конкатенации второй схемы скалярного квантования.

8. Способ по любому из предыдущих пунктов, отличающийся тем, что наибольший размер шага первой и/или второй схемы скалярного квантования приблизительно в четыре раза больше наименьшего размера шага первой и/или второй схемы скалярного квантования.

9. Машиночитаемый носитель, содержащий команды машинного кода, предназначенные для выполнения способа по любому из пп. 1-8 при выполнении посредством устройства, имеющего возможность обработки.

10. Аудиокодер для квантования параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, содержащий:

принимающий компонент, выполненный с возможностью приема по меньшей мере первого параметра и второго параметра для квантования;

первый компонент квантования, расположенный ниже по потоку от принимающего компонента, выполненный с возможностью квантования первого параметра на основе первой схемы скалярного квантования, имеющей неравномерные размеры шага, для получения квантованного первого параметра, причем неравномерные размеры шага выбраны таким образом, что меньшие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным;

компонент деквантования, выполненный с возможностью приема первого квантованного параметра от первого компонента квантования и деквантования квантованного первого параметра с использованием первой схемы скалярного квантования для получения деквантованного первого параметра, являющегося приближенным представлением первого параметра;

компонент определения коэффициента масштабирования, выполненный с возможностью приема деквантованного первого параметра, обращения к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определения коэффициента масштабирования посредством подвергания деквантованного первого параметра действию функции масштабирования; и

второй компонент квантования, выполненный с возможностью приема второго параметра и коэффициента масштабирования и квантования второго параметра на основе коэффициента масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения квантованного второго параметра.

11. Способ в аудиодекодере для деквантования квантованных параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, включающий:

прием по меньшей мере первого квантованного параметра и второго квантованного параметра;

деквантование квантованного первого параметра в соответствии с первой схемой скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного первого параметра, причем неравномерные размеры шага выбираются таким образом, что меньшие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным;

обращение к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определение коэффициента масштабирования посредством подвергания деквантованного первого параметра действию функции масштабирования; и

деквантование второго квантованного параметра на основе функции масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного второго параметра.

12. Способ по п. 11, отличающийся тем, что функция масштабирования является кусочно-линейной функцией.

13. Способ по любому из пп. 11 и 12, отличающийся тем, что этап деквантования второго параметра на основе коэффициента масштабирования и второй схемы скалярного квантования включает деквантование второго квантованного параметра в соответствии со второй схемой скалярного квантования и умножение его результата на коэффициент масштабирования.

14. Способ по любому из пп. 11 и 12, отличающийся тем, что неравномерные размеры шага второй схемы скалярного квантования масштабируют коэффициентом масштабирования до деквантования второго квантованного параметра.

15. Способ по п. 12, отличающийся тем, что неравномерный размер шага второй схемы скалярного квантования возрастает с величиной второго параметра.

16. Способ по п. 12, отличающийся тем, что первая схема скалярного квантования включает больше этапов квантования, чем вторая схема скалярного квантования.

17. Способ по п. 12, отличающийся тем, что первую схему скалярного квантования строят посредством сдвига, зеркального отображения и конкатенации второй схемы скалярного квантования.

18. Способ по п. 12, отличающийся тем, что наибольший размер шага первой и/или второй схемы скалярного квантования приблизительно в четыре раза больше наименьшего размера шага первой и/или второй схемы скалярного квантования.

19. Машиночитаемый носитель, содержащий команды машинного кода, предназначенные для выполнения способа по любому из пп. 11-18 при выполнении посредством устройства, имеющего возможность обработки.

20. Аудиодекодер для деквантования квантованных параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, содержащий:

принимающий компонент, выполненный с возможностью приема по меньшей мере первого квантованного параметра и второго квантованного параметра;

первый компонент деквантования, расположенный ниже по потоку от принимающего компонента и выполненный с возможностью деквантования квантованного первого параметра в соответствии с первой схемой скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного первого параметра, причем неравномерные размеры шага выбираются таким образом, что меньшие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным;

компонент определения коэффициента масштабирования, выполненный с возможностью приема деквантованного первого параметра, обращения к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определения коэффициента масштабирования посредством подвергания деквантованного первого параметра действию функции масштабирования; и

второй компонент деквантования, выполненный с возможностью приема коэффициента масштабирования и второго квантованного параметра и деквантования второго квантованного параметра на основе коэффициента масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного второго параметра.

21. Система кодирования/декодирования звука, содержащая кодер по п. 10 и аудиодекодер по п. 20, отличающаяся тем, что аудиокодер выполнен с возможностью передачи первого и второго квантованных параметров в аудиодекодер.



 

Похожие патенты:

Изобретение относится к области микропрограммного обеспечения. Техническим результатом является сжатие и распаковка микропрограмм.
Изобретение относится к области информационных технологий и может быть использовано для сжатия массивов данных с возможностью их последующего восстановления. Технический результат – повышение универсальности способа за счет обеспечения оперативного восстановления данных после сжатия.

Изобретение относится к обработке аудиосигналов или сигналов изображения, в частности к кодированию или декодированию аудиосигналов или сигналов изображения при наличии переходов.

Изобретение относится области информационных технологий и, в частности, к обработке объекта данных. Техническим результатом является повышение эффективности хранения обработанных данных.

Изобретение относится к обработке аудиосигналов и предназначено для кодирования или декодирования аудиосигналов при наличии переходов. Технический результат - предоставление усовершенствованного аудиокодирования/декодирования, обеспечивающего повышение производительности устройства.

Изобретение относится к векторному квантователю и связанному с ним способу эффективного векторного квантования, например, в аудиокодеке преобразования. Технический результат – уменьшение вычислительной сложности.

Изобретение относится к области сжатия и распаковки данных без потерь. Технический результат - простота реализации с одновременным уменьшением времени передачи данных, повышение информационной вместимости без потерь информации за счет сокращения необходимого объема памяти для хранения последовательности двоичных символов.

Изобретение относится к области сжатия данных и может использоваться при хранении больших объемов данных, содержащих избыточность. Технический результат заключается в устранении избыточности в обработанных цифровых данных.

Изобретение относится к кодированию и декодированию и предназначено для осуществления высокочастотной реконструкции аудиосигнала. Технический результат – обеспечение улучшенной реконструкции переходных процессов и тональных компонентов в высокочастотных полосах.

Изобретение относится к передаче цифровых звуковых сигналов по телекоммуникационным сетям и предназначено для обработки ослабления опережающего эха при декодировании цифрового звукового сигнала.

Изобретение относится к средствам для преобразования вещественное-в-комплексное с малой задержкой. Технический результат заключается в уменьшении задержки преобразования.

Изобретение относится к маскированию ошибок в кадрах на основе кадров, включающих в себя векторы коэффициента преобразования. Технический результат – улучшенное маскирование ошибок в кадрах за счет отсутствия передачи дополнительных сторонних параметров или формирования дополнительных задержек, требуемых интерполяцией.

Изобретение относится к средствам для пространственного кодирования аудиообъектов. Технический результат заключается в повышении качества кодирования аудиообъектов.

Изобретение относится к кодированию и декодированию аудио сигналов. Технический результат – обеспечение возможности улучшения восстановления звукового объекта.

Изобретение относится к технике кодирования и декодирования информации и может быть использовано для получения декодированной аудио информации на основе кодированной аудио информации.

Изобретение относится к области кодирования и декодирования. Техническим результатом является способ декодирования и устройство декодирования, которые позволяют предотвращать или уменьшать явление шума во время обработки потерь кадров, за счет этого повышая качество речи.

Изобретение относится к средствам для маскировки потери аудиокадров. Технический результат заключается в повышении качества маскирования в случае потери аудиокадра.

Изобретение относится к обработке аудиосигналов или сигналов изображения, в частности к кодированию или декодированию аудиосигналов или сигналов изображения при наличии переходов.

Изобретение относится к средствам посегментной настройки пространственного аудиосигнала к другой установке громкоговорителей для воспроизведения. Технический результат заключается в сохранении пространственного образа аудиосцены при перенастройке аудиосигнала к другой установке громкоговорителей.

Изобретение относится к средствам для пространственного кодирования аудиообъектов. Технический результат заключается в повышении качества кодированного аудиосигнала.

Изобретение относится к средствам для параметрического кодирования аудио. Технический результат заключается в повышении эффективности кодирования. Декодер содержит узел параметрического декодирования для генерирования множества первых оцененных сигналов аудиообъектов посредством повышающего микширования трех или более сигналов понижающего микширования. Узел параметрического декодирования сконфигурирован с возможностью повышающего микширования упомянутых трех или более сигналов понижающего микширования в зависимости от параметрической побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов. Более того, декодер содержит узел обработки остатка для генерирования множества вторых оцененных сигналов аудиообъектов посредством модификации одного или более из упомянутых первых оцененных сигналов аудиообъектов. Узел обработки остатка сконфигурирован с возможностью модификации упомянутого одного или более из упомянутых первых оцененных сигналов аудиообъектов в зависимости от одного или более остаточных сигналов. 9 н. и 17 з.п. ф-лы, 18 ил.
Наверх