Способ и устройство для определения параметра межканальной временной разности

Изобретение относится к области обработки аудио. Технический результат - уменьшение объема вычислений в процессе поиска и вычисление межканальной временной разности в процессе кодирования стерео. Способ включает в себя: определение опорного параметра согласно сигналу временной области в первом и втором звуковых каналах, где опорный параметр соответствует последовательности получения сигнала временной области в первом и втором звуковых каналах, и сигналы временной области в первом и втором звуковых каналах соответствуют одному и тому же периоду времени (S110); определение диапазона поиска согласно опорному параметру и ограничительному значению Tmax, где ограничительное значение Tmax определяется согласно частоте выборки сигнала временной области в первом звуковом канале, и диапазон поиска попадает в пределы [-Tmax, 0] или диапазон поиска попадает в пределы [0, Tmax] (S120); и выполнение обработки осуществления поиска в пределах диапазона поиска на основе сигналов частотной области в первом и втором звуковых каналах, чтобы определить первый параметр межканальной временной разности ITD, соответствующий первому звуковому каналу и второму звуковому каналу (S130). 2 н. и 8 з.п. ф-лы, 6 ил.

 

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

[0001] Настоящее изобретение относится к области обработки аудио, и более конкретно, к способу и устройству для определения параметра межканальной временной разности.

УРОВЕНЬ ТЕХНИКИ

[0002] Улучшение качества жизни сопровождается постоянным повышением требований людей к высококачественному аудио. По сравнению с моноаудио, стереоаудио обеспечивает ощущение направления и ощущение распределения источников звука и может повысить чистоту и разборчивость информации, и вследствие этого является сильно предпочитаемым людьми.

[0003] В настоящее время, известна технология для передачи стереоаудиосигнала. Кодер преобразовывает стереосигнал в моноаудиосигнал и параметр, такой как межканальная временная разность (ITD, межканальная временная разность), раздельно кодирует моноаудиосигнал и параметр, и передает кодированный моноаудиосигнал и кодированный параметр декодеру. После получения моноаудиосигнала, декодер дополнительно восстанавливает стереосигнал согласно параметру, такому как ITD. Вследствие этого, может быть реализована передача стереосигнала с низким количеством битов и высоким качеством.

[0004] В вышеуказанной технологии, на основе частоты выборки сигнала временной области в моноаудио, кодер может определить ограничительное значение Tmax ITD-параметра при частоте выборки, и вследствие этого может выполнить поиск и вычисление подполосы посредством подполосы в диапазоне [-Tmax, Tmax] на основе сигнала частотной области, чтобы получить ITD-параметр.

[0005] Однако, вышеуказанный относительно большой диапазон поиска вызывает большое объем вычислений в процессе определения ITD-параметра в частотной области в данной области техники. Следовательно, требование к производительности кодера увеличивается, и оказывается влияние на эффективность обработки.

[0006] Вследствие этого, ожидается предоставление технологии, так чтобы объем вычислений в процессе поиска и вычисления ITD-параметра мог быть уменьшен, при этом гарантировалась бы точность ITD-параметра.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0007] Варианты осуществления настоящего изобретения предусматривают способ и устройство для определения параметра межканальной временной разности, чтобы уменьшить объем вычислений в процессе поиска и вычисления параметра межканальной временной разности в процессе кодирования стерео.

[0008] Согласно первому аспекту, предусматривается способ определения параметра межканальной временной разности, где способ включает в себя: определение опорного параметра согласно сигналу временной области в первом звуковом канале и сигналу временной области во втором звуковом канале, где опорный параметр соответствует последовательности получения сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, и сигнал временной области в первом звуковом канале и сигнал временной области во втором звуковом канале соответствуют одному и тому же периоду времени; определение диапазона поиска согласно опорному параметру и ограничительному значению Tmax, где ограничительное значение Tmax определяется согласно частоте выборки сигнала временной области в первом звуковом канале, и диапазон поиска попадает в пределы [-Tmax, 0], или диапазон поиска попадает в пределы [0, Tmax]; и выполнение обработки осуществления поиска в пределах диапазона поиска на основе сигнала частотной области в первом звуковом канале и сигнала частотной области во втором звуковом канале, чтобы определить первый параметр межканальной временной разности ITD, соответствующий первому звуковому каналу и второму звуковому каналу.

[0009] Со ссылкой на первый аспект, в первой реализации первого аспекта, определение опорного параметра, согласно сигналу временной области в первом звуковом канале и сигналу временной области во втором звуковом канале, включает в себя: выполнение обработки перекрестной корреляции в отношении сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, чтобы определить первое значение обработки перекрестной корреляции и второе значение обработки перекрестной корреляции, где первое значение обработки перекрестной корреляции является максимальным значением функции, в пределах предварительно заданного диапазона, для функции перекрестной корреляции сигнала временной области в первом звуковом канале относительно сигнала временной области во втором звуковом канале, и второе значение обработки перекрестной корреляции является максимальным значением функции, в пределах предварительно заданного диапазона, для функции перекрестной корреляции сигнала временной области во втором звуковом канале относительно сигнала временной области в первом звуковом канале; и определение опорного параметра согласно взаимосвязи значений между первым значением обработки перекрестной корреляции и вторым значением обработки перекрестной корреляции.

[0010] Со ссылкой на первый аспект и вышеуказанную реализацию первого аспекта, во второй реализации первого аспекта, опорный параметр является индексным значением, соответствующим большему одному из первого значения обработки перекрестной корреляции и второго значения обработки перекрестной корреляции, или противоположному числу индексного значения.

[0011] Со ссылкой на первый аспект и вышеуказанную реализацию первого аспекта, в третьей реализации первого аспекта, определение опорного параметра, согласно сигналу временной области в первом звуковом канале и сигналу временной области во втором звуковом канале, включает в себя: выполнение обработки обнаружения пика в отношении сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, чтобы определить первое индексное значение и второе индексное значение, где первое индексное значение является индексным значением, соответствующим максимальному значению амплитуды сигнала временной области в первом звуковом канале в пределах предварительно заданного диапазона, и второе индексное значение является индексным значением, соответствующим максимальному значению амплитуды сигнала временной области во втором звуковом канале в пределах предварительно заданного диапазона; и определение опорного параметра согласно взаимосвязи значений между первым индексным значением и вторым индексным значением.

[0012] Со ссылкой на первый аспект или любой из вышеуказанных реализаций первого аспекта, в четвертой реализации первого аспекта, способ дополнительно включает в себя: выполнение обработки сглаживания в отношении первого ITD-параметра на основе второго ITD-параметра, где первый ITD-параметр является ITD-параметром в первом временном периоде, второй ITD-параметр является сглаженным значением ITD-параметра во втором временном периоде, и второй временной период находится перед первым временным периодом.

[0013] Согласно второму аспекту, предусматривается устройство для определения параметра межканальной временной разности, где устройство включает в себя: блок определения, выполненный с возможностью: определения опорного параметра согласно сигналу временной области в первом звуковом канале и сигналу временной области во втором звуковом канале, где опорный параметр соответствует последовательности получения сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, и сигнал временной области в первом звуковом канале и сигнал временной области во втором звуковом канале соответствуют одному и тому же периоду времени; и определения диапазона поиска согласно опорному параметру и ограничительному значению Tmax, где ограничительное значение Tmax определяется согласно частоте выборки сигнала временной области в первом звуковом канале, и диапазон поиска попадает в пределы [-Tmax, 0], или диапазон поиска попадает в пределы [0, Tmax]; и блок обработки, выполненный с возможностью выполнения обработки осуществления поиска в пределах диапазона поиска на основе сигнала частотной области в первом звуковом канале и сигнала частотной области во втором звуковом канале, чтобы определить первый параметр межканальной временной разности ITD, соответствующий первому звуковому каналу и второму звуковому каналу.

[0014] Со ссылкой на второй аспект, в первой реализации второго аспекта, блок определения специально выполнен с возможностью: выполнения обработки перекрестной корреляции в отношении сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, чтобы определить первое значение обработки перекрестной корреляции и второе значение обработки перекрестной корреляции; и определения опорного параметра согласно взаимосвязи значений между первым значением обработки перекрестной корреляции и вторым значением обработки перекрестной корреляции, где первое значение обработки перекрестной корреляции является максимальным значением функции, в пределах предварительно заданного диапазона, для функции перекрестной корреляции сигнала временной области в первом звуковом канале относительно сигнала временной области во втором звуковом канале, и второе значение обработки перекрестной корреляции является максимальным значением функции, в пределах предварительно заданного диапазона, для функции перекрестной корреляции сигнала временной области во втором звуковом канале относительно сигнала временной области в первом звуковом канале.

[0015] Со ссылкой на второй аспект и вышеуказанную реализацию второго аспекта, во второй реализации второго аспекта, блок определения специально выполнен с возможностью определения индексного значения, соответствующего большему одному из первого значения обработки перекрестной корреляции и второго значения обработки перекрестной корреляции или противоположному числу индексного значения, как опорного параметра.

[0016] Со ссылкой на второй аспект и вышеуказанную реализацию второго аспекта, в третьей реализации второго аспекта, блок определения специально выполнен с возможностью: выполнения обработки обнаружения пика в отношении сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, чтобы определить первое индексное значение и второе индексное значение; и определения опорного параметра согласно взаимосвязи значений между первым индексным значением и вторым индексным значением, где первое индексное значение является индексным значением, соответствующим максимальному значению амплитуды сигнала временной области в первом звуковом канале в пределах предварительно заданного диапазона, и второе индексное значение является индексным значением, соответствующим максимальному значению амплитуды сигнала временной области во втором звуковом канале в пределах предварительно заданного диапазона.

[0017] Со ссылкой на второй аспект или любой из вышеуказанных реализаций второго аспекта, в четвертой реализации второго аспекта, блок обработки дополнительно выполнен с возможностью: выполнения обработки сглаживания в отношении первого ITD-параметра на основе второго ITD-параметра, где первый ITD-параметр является ITD-параметром в первом временном периоде, второй ITD-параметр является сглаженным значением ITD-параметра во втором временном периоде, и второй временной период находится перед первым временным периодом.

[0018] Согласно способу и устройству для определения параметра межканальной временной разности в вариантах осуществления настоящего изобретения, опорный параметр, соответствующий последовательности получения сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, определяется во временной области, диапазон поиска может быть определен на основе опорного параметра, и обработка осуществления поиска в отношении сигнала частотной области в первом звуковом канале и сигнала частотной области во втором звуковом канале выполняется в пределах диапазона поиска в частотной области, чтобы определить параметр межканальной временной разности ITD, соответствующий первому звуковому каналу и второму звуковому каналу. В вариантах осуществления настоящего изобретения, диапазон поиска, определенный согласно опорному параметру, попадает в пределы [-Tmax, 0] или [0, Tmax], и является меньшим, чем диапазон поиска предшествующего уровня техники [-Tmax, Tmax], так что объемы поиска и вычисления параметра межканальной временной разности ITD могут быть уменьшены, уменьшается требование производительности для кодера, и улучшается эффективность обработки кодера.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0019] Чтобы более ясно описать технологические решения в вариантах осуществления настоящего изобретения, далее кратко описаны прилагаемые чертежи, требуемые для описания вариантов осуществления настоящего изобретения. Очевидно, прилагаемые чертежи в нижеследующем описании показывают лишь некоторые варианты осуществления настоящего изобретения, и специалист в данной области техники может получить другие чертежи из этих прилагаемых чертежей без творческих усилий.

[0020] Фиг. 1 является принципиальной схемой последовательности операций способа определения параметра межканальной временной разности согласно варианту осуществления настоящего изобретения;

[0021] Фиг. 2 является принципиальной схемой процесса определения диапазона поиска согласно варианту осуществления настоящего изобретения;

[0022] Фиг. 3 является принципиальной схемой процесса определения диапазона поиска согласно другому варианта осуществления настоящего изобретения;

[0023] Фиг. 4 является принципиальной схемой процесса определения диапазона поиска согласно еще одному варианту осуществления настоящего изобретения;

[0024] Фиг. 5 является принципиальной блок-схемой устройства для определения параметра межканальной временной разности согласно варианту осуществления настоящего изобретения; и

[0025] Фиг. 6 является принципиальной структурной схемой устройства для определения параметра межканальной временной разности согласно варианту осуществления настоящего изобретения.

ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

[0026] В дальнейшем ясно описываются технические решения в вариантах осуществления настоящего изобретения со ссылкой на прилагаемые чертежи в вариантах осуществления настоящего изобретения. Очевидно, описанные варианты осуществления являются некоторыми, но не всеми, из вариантов осуществления настоящего изобретения. Все другие варианты осуществления, полученные средним специалистом в данной области техники на основе вариантов осуществления настоящего изобретения без творческих усилий, попадут в объем правовой охраны настоящего изобретения.

[0027] Фиг. 1 является принципиальной схемой последовательности операций способа 100 определения параметра межканальной временной разности согласно варианту осуществления настоящего изобретения. Способ 100 может быть выполнен кодирующим устройством (или может называться устройством стороны передачи) для передачи аудиосигнала. Как показано на Фиг. 1, способ 100 включает в себя нижеследующие этапы:

[0028] S110. Определяют опорный параметр согласно сигналу временной области в первом звуковом канале и сигналу временной области во втором звуковом канале, где опорный параметр соответствует последовательности получения сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, и сигнал временной области в первом звуковом канале и сигнал временной области во втором звуковом канале соответствуют одному и тому же периоду времени.

[0029] S120. Определяют диапазон поиска согласно опорному параметру и ограничительному значению Tmax, где ограничительное значение Tmax определяется согласно частоте выборки сигнала временной области в первом звуковом канале, и диапазон поиска попадает в пределы [-Tmax, 0], или диапазон поиска попадает в пределы [0, Tmax].

[0030] S130. Выполняют обработку осуществления поиска в пределах диапазона поиска на основе сигнала частотной области в первом звуковом канале и сигнала частотной области во втором звуковом канале, чтобы определить первый параметр межканальной временной разности ITD, соответствующий первому звуковому каналу и второму звуковому каналу.

[0031] Способ 100 определения параметра межканальной временной разности в этом варианте осуществления настоящего изобретения может быть применен к аудиосистеме, которая имеет по меньшей мере два звуковых канала. В аудиосистеме, моносигналы по меньшей мере из двух звуковых каналов (то есть, включающих в себя первый звуковой канал и второй звуковой канал) синтезируются в стереосигнал. Например, моносигнал из канала левого аудио (то есть, пример первого звукового канала) и моносигнал из канала правого аудио (то есть, пример второго звукового канала) синтезируются в стереосигнал.

[0032] Технология параметрического стерео (PS) может быть использована как пример способа передачи стереосигнала. В данной технологии, кодер преобразовывает стереосигнал в моносигнал и параметр пространственного восприятия согласно признаку пространственного восприятия, и раздельно кодирует моносигнал и параметр пространственного восприятия. После получения моноаудио, декодер дополнительно восстанавливает стереосигнал согласно параметру пространственного восприятия. В данной технологии может быть реализована передача стереосигнала с низким количеством битов и высоким качеством. Параметр межканальной временной разности ITD (ITD, Inter-Channel Time Difference) является параметром пространственного восприятия, указывающим горизонтальное размещение источника звука для источника звука, и является важной частью параметра пространственного восприятия. Этот вариант осуществления настоящего изобретения в основном относится к процессу определения ITD-параметра. В дополнение, в этом варианте осуществления настоящего изобретения, процесс кодирования и декодирования стереосигнала и моносигнала согласно ITD-параметру аналогичен процессу в предшествующем уровне техники. Чтобы избежать повторения, его подробное описание здесь опущено.

[0033] Следует понимать, что вышеприведенное количество звуковых каналов, включенных в аудиосистему, является лишь примером для описания, и настоящее изобретение не ограничивается этим. Например, аудиосистема может иметь три или более звуковых каналов, и моносигналы из любых двух звуковых каналов могут быть синтезированы в стереосигнал. Для простоты понимания, в примере для описания ниже, способ 100 применяется к аудиосистеме, которая имеет два звуковых канала (то есть, канал левого аудио и канал правого аудио). В дополнение, для простоты дифференциации, для описания канал левого аудио используется как первый звуковой канал, и канал правого аудио используется как второй звуковой канал.

[0034] Конкретно, на этапе S110, кодирующее устройство может получить, например, посредством использования устройства ввода аудио, такого как микрофон, соответствующий каналу левого аудио, аудиосигнал, соответствующий каналу левого аудио, и выполнить обработку осуществления выборки в отношении аудиосигнала согласно предварительно заданной частоте выборки α (то есть, пример частоты выборки сигнала временной области в первом звуковом канале), чтобы сформировать сигнал временной области в канале левого аудио (то есть, пример сигнала временной области в первом звуковом канале, и для простоты понимания и дифференциации обозначенный ниже как сигнал временной области #L). В дополнение, в этом варианте осуществления настоящего изобретения, процесс получения сигнала временной области #L может быть аналогичен процессу в предшествующем уровне техники. Чтобы избежать повторения, его подробное описание здесь опущено.

[0035] В этом варианте осуществления настоящего изобретения, частота выборки сигнала временной области в первом звуковом канале является такой же как частота выборки сигнала временной области во втором звуковом канале. Вследствие этого, аналогично, кодирующее устройство может получить, например, посредством использования устройства ввода аудио, такого как микрофон, соответствующий каналу правого аудио, аудиосигнал, соответствующий каналу правого аудио, и выполнить обработку осуществления выборки в отношении аудиосигнала согласно частоте выборки α, чтобы сформировать сигнал временной области в канале правого аудио (то есть, пример сигнала временной области во втором звуковом канале, и для простоты понимания и дифференциации обозначенный ниже как сигнал временной области #R).

[0036] Следует отметить, что в этом варианте осуществления настоящего изобретения, сигнал временной области #L и сигнал временной области #R являются сигналами временной области, соответствующими одному и тому же периоду времени (или другими словами сигналами временной области, полученными в один и тот же период времени). Например, сигнал временной области #L и сигнал временной области #R могут быть сигналами временной области, соответствующими одному и тому же кадру (то есть, 20 мс). В этом случае, ITD-параметр, соответствующий сигналам в кадре, может быть получен на основе сигнала временной области #L и сигнала временной области #R.

[0037] В качестве другого примера, сигнал временной области #L и сигнал временной области #R могут быть сигналами временной области, соответствующими одному и тому же подкадру (то есть, 10 мс, 5 мс или подобному) в одном и том же кадре. В этом случае, многочисленные ITD-параметры, соответствующие сигналам в кадре, могут быть получены на основе сигнала временной области #L и сигнала временной области #R. Например, если подкадр, соответствующий сигналу временной области #L и сигналу временной области #R составляет 10 мс, могут быть получены два ITD-параметра посредством использования сигналов в кадре (то есть, 20 мс). В качестве другого примера, если подкадр, соответствующий сигналу временной области #L и сигналу временной области #R составляет 5 мс, могут быть получены четыре ITD-параметра посредством использования сигналов в кадре (то есть, 20 мс).

[0038] Следует понимать, что вышеприведенные продолжительности периода времени, соответствующего сигналу временной области #L и сигналу временной области #R, являются лишь примерами для описания, и настоящее изобретение не ограничивается этим. Продолжительность периода времени может быть случайным образом изменена согласно требованию.

[0039] Затем, кодирующее устройство может определить опорный параметр согласно сигналу временной области #L и сигналу временной области #R. Опорный параметр может соответствовать последовательности получения сигнала временной области #L и сигнала временной области #R (например, последовательности ввода сигнала временной области #L и сигнала временной области #R в устройство ввода аудио). Впоследствии, соответствие описывается подробно со ссылкой на процесс определения опорного параметра.

[0040] В этом варианте осуществления настоящего изобретения, опорный параметр может быть определен посредством выполнения обработки перекрестной корреляции в отношении сигнала временной области #L и сигнала временной области #R (то есть, способом 1), или опорный параметр может быть определен посредством поиска максимальных значений амплитуды сигнала временной области #L и сигнала временной области #R (то есть, способом 2). Нижеследующее раздельно подробно описывает способ 1 и способ 2.

[0041] Способ 1:

[0042] Необязательно, определение опорного параметра, согласно сигналу временной области в первом звуковом канале и сигналу временной области во втором звуковом канале, включает в себя:

выполнение обработки перекрестной корреляции в отношении сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, чтобы определить первое значение обработки перекрестной корреляции и второе значение обработки перекрестной корреляции, где первое значение обработки перекрестной корреляции является максимальным значением функции, в пределах предварительно заданного диапазона, для функции перекрестной корреляции сигнала временной области в первом звуковом канале относительно сигнала временной области во втором звуковом канале, и второе значение обработки перекрестной корреляции является максимальным значением функции, в пределах предварительно заданного диапазона, для функции перекрестной корреляции сигнала временной области во втором звуковом канале относительно сигнала временной области в первом звуковом канале; и

определение опорного параметра согласно взаимосвязи значений между первым значением обработки перекрестной корреляции и вторым значением обработки перекрестной корреляции.

[0043] Конкретно, в этом варианте осуществления настоящего изобретения, кодирующее устройство может определить, согласно нижеследующей формуле 1, функцию перекрестной корреляции сигнала временной области #L относительно сигнала временной области #R, т.е.:

формула 1

[0044] указывает ограничительное значение ITD-параметра (или другими словами максимальное значение получения временной разницы между сигналом временной области #L и сигналом временной области #R), и может быть определено согласно частоте выборки α. В дополнение, способ определения может быть аналогичен способам в предшествующем уровне техники. Чтобы избежать повторения, его подробное описание здесь опущено. Указывает значение сигнала для сигнала временной области #R в jой точке выборки, указывает значение сигнала для сигнала временной области #L в (j+i)ой точке выборки, и указывает общее количество точек выборки, включенных в сигнал временной области #R, или другими словами продолжительность сигнала временной области #R. Например, продолжительностью может быть продолжительность кадра (то есть, 20 мс), или продолжительность подкадра (то есть, 10 мс, 5 мс, или подобное).

[0045] В дополнение, кодирующее устройство может определить максимальное значение функции перекрестной корреляции .

[0046] Аналогично, кодирующее устройство может определить, согласно нижеследующей формуле 2, функцию перекрестной корреляции сигнала временной области #R относительно сигнала временной области #L, т.е.:

формула 2

[0047] В дополнение, кодирующее устройство может определить максимальное значение функции перекрестной корреляции .

[0048] В этом варианте осуществления настоящего изобретения, кодирующее устройство может определить значение опорного параметра согласно взаимосвязи между и нижеследующим способом 1A или способом 1B.

[0049] Способ 1A:

[0050] Как показано на Фиг. 2, если , кодирующее устройство может определить, что сигнал временной области #L получен до сигнала временной области #R, то есть, ITD-параметр канала левого аудио и канала правого аудио является положительным числом. В этом случае, опорный параметр T может быть задан в значение 1.

[0051] Вследствие этого, в процессе определения на этапе S120, кодирующее устройство может определить, что опорный параметр больше, чем 0, и дополнительно определить, что диапазон поиска составляет [0, Tmax]. То есть, когда сигнал временной области #L получен до сигнала временной области #R, ITD-параметр является положительным числом, и диапазон поиска составляет [0, Tmax] (то есть, пример диапазона поиска, который попадает в пределы [0, Tmax]).

[0052] В качестве альтернативы, если , кодирующее устройство может определить, что сигнал временной области #L получен после сигнала временной области #R, то есть, ITD-параметр канала левого аудио и канала правого аудио является отрицательным числом. В этом случае, опорный параметр T может быть задан в значение 0.

[0053] Вследствие этого, в процессе определения на этапе S120, кодирующее устройство может определить, что опорный параметр не больше, чем 0, и дополнительно определить, что диапазон поиска составляет [-Tmax, 0]. То есть, когда сигнал временной области #L получен после сигнала временной области #R, ITD-параметр является отрицательным числом, и диапазон поиска составляет [-Tmax, 0] (то есть, пример диапазона поиска, который попадает в пределы [-Tmax, 0]).

[0054] Способ 1B:

[0055] Необязательно, опорный параметр является индексным значением, соответствующим большему одному из первого значения обработки перекрестной корреляции и второго значения обработки перекрестной корреляции, или противоположному числу индексного значения.

[0056] Конкретно, как показано на Фиг. 3, если , кодирующее устройство может определить, что сигнал временной области #L получен до сигнала временной области #R, то есть, ITD-параметр канала левого аудио и канала правого аудио является положительным числом. В этом случае, опорный параметр T может быть задан в значение индексного значения, соответствующего .

[0057] Вследствие этого, в последующем процессе определения, после определения, что опорный параметр T больше, чем 0, кодирующее устройство может дополнительно определить, является ли опорный параметр T большим, чем Tmax/2, или равным ему, и определить диапазон поиска согласно результату определения. Например, когда T≥Tmax/2, диапазон поиска составляет [Tmax/2, Tmax] (то есть, пример диапазона поиска, который попадает в пределы [0, Tmax]. Когда T<Tmax/2, диапазон поиска составляет [0, Tmax/2] (то есть, другой пример диапазона поиска, который попадает в пределы [0, Tmax]).

[0058] В качестве альтернативы, если , кодирующее устройство может определить, что сигнал временной области #L получен после сигнала временной области #R, то есть, ITD-параметр канала левого аудио и канала правого аудио является отрицательным числом. В этом случае, опорный параметр T может быть задан в значение противоположного числа индексного значения, соответствующего .

[0059] Вследствие этого, в процессе определения на этапе S120, после определения, что опорный параметр T меньше, чем 0, или равен ему, кодирующее устройство может дополнительно определить, является ли опорный параметр T меньшим, чем -Tmax/2, или равным ему, и определить диапазон поиска согласно результату определения. Например, когда T≤-Tmax/2, диапазон поиска составляет [-Tmax, -Tmax/2] (то есть, пример диапазона поиска, который попадает в пределы [-Tmax, 0]. Когда T>-Tmax/2, диапазон поиска составляет [-Tmax/2, 0] (то есть, другой пример диапазона поиска, который попадает в пределы [-Tmax, 0].

[0060] Способ 2:

[0061] Необязательно, определение опорного параметра, согласно сигналу временной области в первом звуковом канале и сигналу временной области во втором звуковом канале, включает в себя:

выполнение обработки обнаружения пика в отношении сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, чтобы определить первое индексное значение и второе индексное значение, где первое индексное значение является индексным значением, соответствующим максимальному значению амплитуды сигнала временной области в первом звуковом канале в пределах предварительно заданного диапазона, и второе индексное значение является индексным значением, соответствующим максимальному значению амплитуды сигнала временной области во втором звуковом канале в пределах предварительно заданного диапазона; и

определение опорного параметра согласно взаимосвязи значений между первым индексным значением и вторым индексным значением.

[0062] Конкретно, в этом варианте осуществления настоящего изобретения, кодирующее устройство может обнаружить максимальное значение для значения амплитуды (обозначенного как ) сигнала временной области #L, и записать индексное значение , соответствующее . указывает общее количество точек выборки, включенных в сигнал временной области #L.

[0063] В дополнение, кодирующее устройство может обнаружить максимальное значение для значения амплитуды (обозначенного как ) сигнала временной области #R, и записать индексное значение , соответствующее . указывает общее количество точек выборки, включенных в сигнал временной области #R.

[0064] Затем, кодирующее устройство может определить взаимосвязь значений между и .

[0065] Как показано на Фиг. 4, если , кодирующее устройство может определить, что сигнал временной области #L получен до сигнала временной области #R, то есть, ITD-параметр канала левого аудио и канала правого аудио является положительным числом. В этом случае, опорный параметр T может быть задан в значение 1.

[0066] Вследствие этого, в процессе определения на этапе S120, кодирующее устройство может определить, что опорный параметр больше, чем 0, и дополнительно определить, что диапазон поиска составляет [0, Tmax]. То есть, когда сигнал временной области #L получен до сигнала временной области #R, ITD-параметр является положительным числом, и диапазон поиска составляет [0, Tmax] (то есть, пример диапазона поиска, который попадает в пределы [0, Tmax]).

[0067] В качестве альтернативы, если , кодирующее устройство может определить, что сигнал временной области #L получен после сигнала временной области #R, то есть, ITD-параметр канала левого аудио и канала правого аудио является отрицательным числом. В этом случае, опорный параметр T может быть задан в значение 0.

[0068] Вследствие этого, в процессе определения на этапе S120, кодирующее устройство может определить, что опорный параметр не больше, чем 0, и дополнительно определить, что диапазон поиска составляет [-Tmax, 0]. То есть, когда сигнал временной области #L получен после сигнала временной области #R, ITD-параметр является отрицательным числом, и диапазон поиска составляет [-Tmax, 0] (то есть, пример диапазона поиска, который попадает в пределы [-Tmax, 0]).

[0069] На этапе S130, кодирующее устройство может выполнить обработку временно-частотного преобразования в отношении сигнала временной области #L для получения сигнала частотной области в канале левого аудио (то есть, пример сигнала частотной области в первом звуковом канале, и для простоты понимания и дифференциации обозначенный ниже как сигнал частотной области #L), и может выполнить обработку временно-частотного преобразования в отношении сигнала временной области #R для получения сигнала частотной области в канале правого аудио (то есть, пример сигнала частотной области во втором звуковом канале, и для простоты понимания и дифференциации обозначенный ниже как сигнал частотной области #R).

[0070] Например, в этом варианте осуществления настоящего изобретения, обработка временно-частотного преобразования может быть выполнена посредством использования технологии быстрого преобразования Фурье (FFT, Fast Fourier Transformation) на основе нижеследующей формулы 3:

формула 3

[0071] указывает сигнал частотной области, указывает продолжительность временно-частотного преобразования, указывает сигнал временной области (то есть, сигнал временной области #L или сигнал временной области #R), и указывает общее количество точек выборки, включенных в сигнал временной области.

[0072] Следует понимать, что вышеприведенный процесс обработки временно-частотного преобразования является лишь примером для описания, и настоящее изобретение не ограничивается этим. Способ и процесс обработки временно-частотного преобразования могут быть аналогичными способу и процессу в предшествующем уровне техники. Например, может использоваться технология, такая как модифицированное дискретное косинусное преобразование (MDCT, Modified Discrete Cosine Transform).

[0073] Вследствие этого, кодирующее устройство может выполнить обработку осуществления поиска в отношении определенного сигнала частотной области #L и сигнала частотной области #R в пределах определенного диапазона поиска, чтобы определить ITD-параметр канала левого аудио и канала правого аудио. Например, может быть использован нижеследующий процесс обработки осуществления поиска.

[0074] Сначала, кодирующее устройство может классифицировать частоты сигнала частотной области на Nsubband подполос (например, одну подполосу) согласно предварительно заданной полосе пропускания . Частота, включенная в kую подполосу , отвечает .

[0075] В пределах вышеприведенного диапазона поиска, функция корреляции сигнала частотной области #L вычисляется согласно нижеследующей формуле 4:

формула 4

[0076] указывает значение сигнала для сигнала частотной области #L на bой частоте, указывает значение сигнала для сигнала частотной области #R на bой частоте, указывает продолжительность временно-частотного преобразования, и диапазон значений является определенным диапазоном поиска. Для простоты понимания и описания, диапазон поиска обозначается как [a, b].

[0077] Значение ITD-параметра kой подполосы составляет , то есть, индексное значение, соответствующее максимальному значению для .

[0078] Вследствие этого, может быть получено одно или более (соответственно определенному количеству подполос) значений ITD-параметров канала левого аудио и канала правого аудио.

[0079] Затем, кодирующее устройство может дополнительно выполнить обработку квантования и подобное в отношении значения ITD-параметра, и отправить обработанное значение ITD-параметра и моносигнал, полученный после обработки, такой что понижающие микширование выполняется в отношении сигналов в канале левого аудио и канале правого аудио, декодирующему устройству (или другими словами устройству стороны приема).

[0080] Декодирующее устройство может восстановить стереоаудиосигнал согласно моноаудиосигналу и значению ITD-параметра.

[0081] Необязательно, способ дополнительно включает в себя:

выполнение обработки сглаживания в отношении первого ITD-параметра на основе второго ITD-параметра, где первый ITD-параметр является ITD-параметром в первом временном периоде, второй ITD-параметр является сглаженным значением ITD-параметра во втором временном периоде, и второй временной период находится перед первым временным периодом.

[0082] Конкретно, в этом варианте осуществления настоящего изобретения, перед выполнением обработки квантования в отношении значения ITD-параметра, кодирующее устройство может дополнительно выполнить обработку сглаживания в отношении определенного значения ITD-параметра. В качестве примера, а не ограничения, кодирующее устройство может выполнить обработку сглаживания согласно нижеследующей формуле 5:

формула 5

[0083] указывает значение ITD-параметра, в отношении которого была выполнена обработка сглаживания, и который соответствует kому кадру или kому подкадру, указывает значение ITD-параметра, в отношении которого была выполнена обработка сглаживания, и который соответствует (k-1)ому кадру или (k-1)ому подкадру, указывает значение ITD-параметра, в отношении которого обработка сглаживания не была выполнена, и который соответствует kому кадру или the kому подкадру, w1 и w2 являются коэффициентами сглаживания, и w1 и w2 могут быть заданы константами, или w1 и w2 могут быть заданы согласно разницы между и , предполагающей, что верно w1+w2=1. В дополнение, когда k=1, может быть предварительно заданным значением.

[0084] Следует отметить, что в способе определения параметра межканальной временной разности в этом варианте осуществления настоящего изобретения, обработка сглаживания может быть выполнена кодирующим устройством, или может быть выполнена декодирующим устройством, и это особым образом не ограничивается в настоящем изобретении. То есть, кодирующее устройство может непосредственно отправить полученное значение ITD-параметра декодирующему устройству без выполнения обработки сглаживания, и декодирующее устройство выполняет обработку сглаживания в отношении значения ITD-параметра. В дополнение, способ и процесс выполнения обработки сглаживания декодирующим устройством могут быть аналогичными вышеприведенным способу и процессу выполнения обработки сглаживания кодирующим устройством. Чтобы избежать повторения, его подробное описание здесь опущено.

[0085] Согласно способу определения параметра межканальной временной разности в этом варианте осуществления настоящего изобретения, опорный параметр, соответствующий последовательности получения сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, определяется во временной области, диапазон поиска может быть определен на основе опорного параметра, и обработка осуществления поиска в отношении сигнала частотной области в первом звуковом канале и сигнала частотной области во втором звуковом канале выполняется в пределах диапазона поиска в частотной области, чтобы определить параметр межканальной временной разности ITD, соответствующий первому звуковому каналу и второму звуковому каналу. В этом варианте осуществления настоящего изобретения, диапазон поиска, определенный согласно опорному параметру, попадает в пределы [-Tmax, 0] или [0, Tmax], и является меньшим, чем диапазон поиска предшествующего уровня техники [-Tmax, Tmax], так что объемы поиска и вычисления параметра межканальной временной разности ITD могут быть уменьшены, уменьшается требование производительности для кодера, и улучшается эффективность обработки кодера.

[0086] Способ определения параметра межканальной временной разности согласно вариантам осуществления настоящего изобретения описан подробно выше со ссылкой на Фиг. 1 - Фиг. 4. Устройство для определения параметра межканальной временной разности согласно варианту осуществления настоящего изобретения описано подробно ниже со ссылкой на Фиг. 5.

[0087] Фиг. 5 является принципиальной блок-схемой устройства 200 для определения параметра межканальной временной разности согласно варианту осуществления настоящего изобретения. Как показано на Фиг. 5, устройство 200 включает в себя:

блок 210 определения, выполненный с возможностью: определения опорного параметра согласно сигналу временной области в первом звуковом канале и сигналу временной области во втором звуковом канале, где опорный параметр соответствует последовательности получения сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, и сигнал временной области в первом звуковом канале и сигнал временной области во втором звуковом канале соответствуют одному и тому же периоду времени; и определения диапазона поиска согласно опорному параметру и ограничительному значению Tmax, где ограничительное значение Tmax определяется согласно частоте выборки сигнала временной области в первом звуковом канале, и диапазон поиска попадает в пределы [-Tmax, 0], или диапазон поиска попадает в пределы [0, Tmax]; и

блок 220 обработки, выполненный с возможностью выполнения обработки осуществления поиска в пределах диапазона поиска на основе сигнала частотной области в первом звуковом канале и сигнала частотной области во втором звуковом канале, чтобы определить первый параметр межканальной временной разности ITD, соответствующий первому звуковому каналу и второму звуковому каналу.

[0088] Необязательно, блок 210 определения специально выполнен с возможностью: выполнения обработки перекрестной корреляции в отношении сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, чтобы определить первое значение обработки перекрестной корреляции и второе значение обработки перекрестной корреляции; и определения опорного параметра согласно взаимосвязи значений между первым значением обработки перекрестной корреляции и вторым значением обработки перекрестной корреляции. Первое значение обработки перекрестной корреляции является максимальным значением функции, в пределах предварительно заданного диапазона, для функции перекрестной корреляции сигнала временной области в первом звуковом канале относительно сигнала временной области во втором звуковом канале, и второе значение обработки перекрестной корреляции является максимальным значением функции, в пределах предварительно заданного диапазона, для функции перекрестной корреляции сигнала временной области во втором звуковом канале относительно сигнала временной области в первом звуковом канале.

[0089] Необязательно, блок 210 определения специально выполнен с возможностью определения индексного значения, соответствующего большему одному из первого значения обработки перекрестной корреляции и второго значения обработки перекрестной корреляции, или противоположному числу индексного значения, как опорного параметра.

[0090] Необязательно, блок 210 определения специально выполнен с возможностью: выполнения обработки обнаружения пика в отношении сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, чтобы определить первое индексное значение и второе индексное значение; и определения опорного параметра согласно взаимосвязи значений между первым индексным значением и вторым индексным значением. Первое индексное значение является индексным значением, соответствующим максимальному значению амплитуды сигнала временной области в первом звуковом канале в пределах предварительно заданного диапазона, и второе индексное значение является индексным значением, соответствующим максимальному значению амплитуды сигнала временной области во втором звуковом канале в пределах предварительно заданного диапазона.

[0091] Необязательно, блок 220 обработки дополнительно выполнен с возможностью выполнения обработки сглаживания в отношении первого ITD-параметра на основе второго ITD-параметра. Первый ITD-параметр является ITD-параметром в первом временном периоде, второй ITD-параметр является сглаженным значением ITD-параметра во втором временном периоде, и второй временной период находится перед первым временным периодом.

[0092] Устройство 200 для определения параметра межканальной временной разности, согласно этому варианту осуществления настоящего изобретения, выполнено с возможностью выполнения способа 100 определения параметра межканальной временной разности в вариантах осуществления настоящего изобретения, и может соответствовать кодирующему устройству в способе в вариантах осуществления настоящего изобретения. В дополнение, блоки и модули в устройстве 200 для определения параметра межканальной временной разности и вышеприведенные другие операции и/или функции по-отдельности предназначены для реализации соответствующей процедуры в способе 100 на Фиг. 1. Для краткости, подробности здесь не описываются.

[0093] Согласно устройству для определения параметра межканальной временной разности в этом варианте осуществления настоящего изобретения, опорный параметр, соответствующий последовательности получения сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, определяется во временной области, диапазон поиска может быть определен на основе опорного параметра, и обработка осуществления поиска в отношении сигнала частотной области в первом звуковом канале и сигнала частотной области во втором звуковом канале выполняется в пределах диапазона поиска в частотной области, чтобы определить параметр межканальной временной разности ITD, соответствующий первому звуковому каналу и второму звуковому каналу. В этом варианте осуществления настоящего изобретения, диапазон поиска, определенный согласно опорному параметру, попадает в пределы [-Tmax, 0] или [0, Tmax], и является меньшим, чем диапазон поиска предшествующего уровня техники [-Tmax, Tmax], так что объемы поиска и вычисления параметра межканальной временной разности ITD могут быть уменьшены, уменьшается требование производительности для кодера, и улучшается эффективность обработки кодера.

[0094] Способ определения параметра межканальной временной разности согласно вариантам осуществления настоящего изобретения описан подробно выше со ссылкой на Фиг. 1 - Фиг. 4. Устройство для определения параметра межканальной временной разности согласно варианту осуществления настоящего изобретения описано подробно ниже со ссылкой на Фиг. 6.

[0095] Фиг. 6 является принципиальной блок-схемой устройства 300 для определения параметра межканальной временной разности согласно варианту осуществления настоящего изобретения. Как показано на Фиг. 6, устройство 300 может включать в себя:

шину 310;

процессор 320, соединенный с шиной; и

память 330, соединенную с шиной.

[0096] Процессор 320 задействует, посредством использования шины 310, программу, хранящуюся в памяти 330, для того, чтобы: определить опорный параметр согласно сигналу временной области в первом звуковом канале и сигналу временной области во втором звуковом канале, где опорный параметр соответствует последовательности получения сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, и сигнал временной области в первом звуковом канале и сигнал временной области во втором звуковом канале соответствуют одному и тому же периоду времени;

определить диапазон поиска согласно опорному параметру и ограничительному значению Tmax, где ограничительное значение Tmax определяется согласно частоте выборки сигнала временной области в первом звуковом канале, и диапазон поиска попадает в пределы [-Tmax, 0], или диапазон поиска попадает в пределы [0, Tmax]; и

выполнить обработку осуществления поиска в пределах диапазона поиска на основе сигнала частотной области в первом звуковом канале и сигнала частотной области во втором звуковом канале, чтобы определить первый параметр межканальной временной разности ITD, соответствующий первому звуковому каналу и второму звуковому каналу.

[0097] Необязательно, процессор 320 специально выполнен с возможностью: выполнения обработки перекрестной корреляции в отношении сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, чтобы определить первое значение обработки перекрестной корреляции и второе значение обработки перекрестной корреляции, где первое значение обработки перекрестной корреляции является максимальным значением функции, в пределах предварительно заданного диапазона, для функции перекрестной корреляции сигнала временной области в первом звуковом канале относительно сигнала временной области во втором звуковом канале, и второе значение обработки перекрестной корреляции является максимальным значением функции, в пределах предварительно заданного диапазона, для функции перекрестной корреляции сигнала временной области во втором звуковом канале относительно сигнала временной области в первом звуковом канале; и

определения опорного параметра согласно взаимосвязи значений между первым значением обработки перекрестной корреляции и вторым значением обработки перекрестной корреляции.

[0098] Необязательно, опорный параметр является индексным значением, соответствующим большему одному из первого значения обработки перекрестной корреляции и второго значения обработки перекрестной корреляции, или противоположному числу индексного значения.

[0099] Необязательно, процессор 320 специально выполнен с возможностью: выполнения обработки обнаружения пика в отношении сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, чтобы определить первое индексное значение и второе индексное значение, где первое индексное значение является индексным значением, соответствующим максимальному значению амплитуды сигнала временной области в первом звуковом канале в пределах предварительно заданного диапазона, и второе индексное значение является индексным значением, соответствующим максимальному значению амплитуды сигнала временной области во втором звуковом канале в пределах предварительно заданного диапазона; и

определения опорного параметра согласно взаимосвязи значений между первым индексным значением и вторым индексным значением.

[0100] Необязательно, процессор 320 дополнительно выполнен с возможностью выполнения обработки сглаживания в отношении первого ITD-параметра на основе второго ITD-параметра, первый ITD-параметр является ITD-параметром в первом временном периоде, второй ITD-параметр является сглаженным значением ITD-параметра во втором временном периоде, и второй временной период находится перед первым временным периодом.

[0101] В этом варианте осуществления настоящего изобретения, компоненты устройства 300 соединены вместе посредством использования шины 310. В дополнение к шине данных, шина 310 дополнительно включает в себя шину питания, шину управления и шину сигнала статуса. Однако, для ясности описания, различные шины помечены как шина 310 на Фигуре.

[0102] Процессор 320 может реализовать или выполнить этапы и логические блок-схемы, раскрытые в вариантах осуществления способа настоящего изобретения. Процессором 320 может быть микропроцессор, или процессором может быть стандартный процессор или декодер, или подобный. Этапы способов, раскрытых со ссылкой на варианты осуществления настоящего изобретения, могут быть непосредственно выполнены и совершены посредством аппаратного процессора, или могут быть выполнены и совершены посредством использования комбинации аппаратных и программных модулей в декодирующем процессоре. Программный модуль может быть размещен на носителе информации, хорошо известном из уровня техники, таком как оперативная память, flash-память, постоянная память, программируемая постоянная память, электрически стираемая программируемая память или регистр. Носитель информации размещается в памяти 330, и процессор считывает информацию в памяти 330 и совершает этапы в вышеприведенных способах в комбинации с аппаратными средствами процессора.

[0103] Следует понимать, что в этом варианте осуществления настоящего изобретения, процессором 320 может быть центральный процессор (Central Processing Unit, "CPU" для краткости), или процессором 320 может быть другой процессор общего назначения, процессора цифровой обработки сигналов (DSP), специализированная интегральная микросхема (ASIC), программируемая пользователем вентильная матрица (FPGA), другое программируемое логическое устройство, дискретный вентиль или транзисторное логическое устройство, дискретный аппаратный компонент или подобное. Процессором общего назначения может быть микропроцессор, или процессором может быть стандартный процессор или подобный.

[0104] Память 330 может включать в себя постоянную память и оперативную память, и предоставлять команды и данные для процессора 320. Часть памяти 330 может дополнительно включать в себя энергонезависимую оперативную память. Например, память 330 может дополнительно хранить информацию о типе устройства.

[0105] В процессе реализации, этапы в вышеупомянутых способах могут быть совершены интегральной логической схемой аппаратных средств в процессоре 320 или командой в виде программного обеспечения. Этапы способов, раскрытых со ссылкой на варианты осуществления настоящего изобретения, могут быть непосредственно выполнены и совершены посредством аппаратного процессора, или могут быть выполнены и совершены посредством использования комбинации аппаратных и программных модулей в процессоре. Программный модуль может быть размещен на носителе информации, хорошо известном из уровня техники, таком как оперативная память, flash-память, постоянная память, программируемая постоянная память, электрически стираемая программируемая память или регистр.

[0106] Устройство 300 для определения параметра межканальной временной разности, согласно этому варианту осуществления настоящего изобретения, выполнено с возможностью выполнения способа 100 определения параметра межканальной временной разности в вариантах осуществления настоящего изобретения, и может соответствовать кодирующему устройству в способе в вариантах осуществления настоящего изобретения. В дополнение, блоки и модули в устройстве 300 для определения параметра межканальной временной разности и вышеприведенные другие операции и/или функции по-отдельности предназначены для реализации соответствующей процедуры в способе 100 на Фиг. 1. Для краткости, подробности здесь не описываются.

[0107] Согласно устройству для определения параметра межканальной временной разности в этом варианте осуществления настоящего изобретения, опорный параметр, соответствующий последовательности получения сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, определяется во временной области, диапазон поиска может быть определен на основе опорного параметра, и обработка осуществления поиска в отношении сигнала частотной области в первом звуковом канале и сигнала частотной области во втором звуковом канале выполняется в пределах диапазона поиска в частотной области, чтобы определить параметр межканальной временной разности ITD, соответствующий первому звуковому каналу и второму звуковому каналу. В этом варианте осуществления настоящего изобретения, диапазон поиска, определенный согласно опорному параметру, попадает в пределы [-Tmax, 0] или [0, Tmax], и является меньшим, чем диапазон поиска предшествующего уровня техники [-Tmax, Tmax], так что объемы поиска и вычисления параметра межканальной временной разности ITD могут быть уменьшены, уменьшается требование производительности для кодера, и улучшается эффективность обработки кодера.

[0108] Следует понимать, что последовательные номера вышеприведенных процессов не означают последовательность выполнения в вариантах осуществления настоящего изобретения. Последовательности выполнения процессов должны быть определены согласно функциям и внутренней логике процессов, и не должны толковаться как какое-либо ограничение процессов реализации вариантов осуществления настоящего изобретения.

[0109] Средний специалист в данной области техники может знать, в комбинации с примерами, описанными в вариантах осуществления, раскрытых в этом описании, о том, что блоки и этапы алгоритма могут быть реализованы посредством электронных аппаратных средств или комбинации компьютерного программного обеспечения и электронных аппаратных средств. Выполняются ли функции посредством аппаратных средств или программного обеспечения зависит от конкретных применений и условий проектных ограничений технических решений. Специалист в данной области техники может использовать разные способы для реализации описанных функций для каждого конкретного применения, но также следует учитывать, что реализация выходит за объем настоящего изобретения.

[0110] Специалисту в данной области техники может быть легко понятно, что, в целях удобства и краткого описания, для подробного рабочего процесса вышеуказанной системы, устройства и блока, ссылаются на соответствующий процесс в вышеуказанных вариантах осуществления способа, и в настоящем документе подробности снова не описываются.

[0111] В нескольких вариантах осуществления, представленных в этой заявке, следует понимать, что раскрытая система, устройство и способ могут быть реализованы другими способами. Например, вариант осуществления описанного устройства является лишь примерным. Например, деление блоков является лишь делением логической функции и может быть другим делением в ходе действительной реализации. Например, многочисленные блоки или компоненты могут быть объединены или интегрированы в другую систему, или некоторые признаки могут быть проигнорированы или не выполнены. В дополнение, отображенные или рассмотренные взаимные связи или прямые связи или коммуникационные соединения могут быть реализованы посредством использования некоторых интерфейсов. Непрямые связи или коммуникационные соединения между устройствами или блоками могут быть реализованы в электронной, механической или других формах.

[0112] Блоки, описанные как отдельные части, могут или не могут быть физически разделены, и части, отображенные как блоки, могут или не могут быть физическими блоками, могут быть размещены в одном положении, или могут быть распределены по многочисленным сетевым блокам. Некоторые или все блоки могут быть выбраны согласно действительным требованиям для достижения целей решений вариантов осуществления.

[0113] В дополнение, функциональные блоки в вариантах осуществления настоящего изобретения могут быть интегрированы в один блок обработки, или каждый из блоков может физически существовать самостоятельно, или два или более блоков интегрированы в один блок.

[0114] Когда функции реализованы в форме программного функционального блока и продаются или используются как независимый продукт, функции могут храниться на компьютерно-читаемом носителе информации. На основе такого понимания, технические решения настоящего изобретения по существу, или часть, участвующая в предшествующем уровне техники, или некоторые из технических решений, могут быть реализованы в форме программного продукта. Программный продукт хранится на носителе информации, и включает в себя несколько команд для подачи команды компьютерному устройству (которым может быть персональный компьютер, сервер или сетевое устройство) выполнить все или некоторые из этапов способов, описанных в вариантах осуществления настоящего изобретения. Вышеуказанный носитель информации включает в себя: любой носитель, который может хранить программный код, такой как USB flash-накопитель, съемный жесткий диск, постоянная память (ROM, Read-Only Memory), оперативная память (RAM, Random Access Memory), магнитный диск, или оптический диск.

[0115] Вышеуказанные описания являются лишь конкретными реализациями настоящего изобретения, но не предназначены для ограничения объема охраны настоящего изобретения. Любая вариация или замена, легко понятая специалисту в данной области техники в рамках технического объема, раскрытого в настоящем изобретении, должна попадать в рамки объема правовой охраны настоящего изобретения. Вследствие этого, объем правовой охраны настоящего изобретения должен быть субъектом для объема правовой охраны формулы изобретения.

1. Способ определения параметра межканальной временной разности, при этом способ содержит этапы, на которых:

определяют опорный параметр согласно сигналу временной области в первом звуковом канале и сигналу временной области во втором звуковом канале, при этом опорный параметр соответствует последовательности получения сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, и сигнал временной области в первом звуковом канале и сигнал временной области во втором звуковом канале соответствуют одному и тому же периоду времени;

определяют диапазон поиска согласно опорному параметру и ограничительному значению Tmax, при этом ограничительное значение Tmax определяется согласно частоте выборки сигнала временной области в первом звуковом канале, и диапазон поиска попадает в пределы [-Tmax, 0] или диапазон поиска попадает в пределы [0, Tmax]; и

выполняют обработку осуществления поиска в пределах диапазона поиска на основе сигнала частотной области в первом звуковом канале и сигнала частотной области во втором звуковом канале, чтобы определить первый параметр межканальной временной разности ITD, соответствующий первому звуковому каналу и второму звуковому каналу.

2. Способ по п. 1, при этом определение опорного параметра согласно сигналу временной области в первом звуковом канале и сигналу временной области во втором звуковом канале содержит этапы, на которых:

выполняют обработку перекрестной корреляции в отношении сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, чтобы определить первое значение обработки перекрестной корреляции и второе значение обработки перекрестной корреляции, при этом первое значение обработки перекрестной корреляции является максимальным значением функции, в пределах предварительно заданного диапазона, для функции перекрестной корреляции сигнала временной области в первом звуковом канале относительно сигнала временной области во втором звуковом канале, и второе значение обработки перекрестной корреляции является максимальным значением функции, в пределах предварительно заданного диапазона, для функции перекрестной корреляции сигнала временной области во втором звуковом канале относительно сигнала временной области в первом звуковом канале; и

определяют опорный параметр согласно взаимосвязи значений между первым значением обработки перекрестной корреляции и вторым значением обработки перекрестной корреляции.

3. Способ по п. 2, при этом опорный параметр является индексным значением, соответствующим большему одному из первого значения обработки перекрестной корреляции и второго значения обработки перекрестной корреляции или противоположному числу индексного значения.

4. Способ по п. 1, при этом определение опорного параметра согласно сигналу временной области в первом звуковом канале и сигналу временной области во втором звуковом канале содержит этапы, на которых:

выполняют обработку обнаружения пика в отношении сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, чтобы определить первое индексное значение и второе индексное значение, при этом первое индексное значение является индексным значением, соответствующим максимальному значению амплитуды сигнала временной области в первом звуковом канале в пределах предварительно заданного диапазона, и второе индексное значение является индексным значением, соответствующим максимальному значению амплитуды сигнала временной области во втором звуковом канале в пределах предварительно заданного диапазона; и

определяют опорный параметр согласно взаимосвязи значений между первым индексным значением и вторым индексным значением.

5. Способ по любому из пп. 1-4, в котором способ дополнительно содержит этап, на котором:

выполняют обработку сглаживания в отношении первого ITD-параметра на основе второго ITD-параметра, при этом первый ITD-параметр является ITD-параметром в первом временном периоде, второй ITD-параметр является сглаженным значением ITD-параметра во втором временном периоде, и второй временной период находится перед первым временным периодом.

6. Устройство для определения параметра межканальной временной разности, при этом устройство содержит:

блок определения, выполненный с возможностью: определения опорного параметра согласно сигналу временной области в первом звуковом канале и сигналу временной области во втором звуковом канале, при этом опорный параметр соответствует последовательности получения сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, и сигнал временной области в первом звуковом канале и сигнал временной области во втором звуковом канале соответствуют одному и тому же периоду времени; и определения диапазона поиска согласно опорному параметру и ограничительному значению Tmax, при этом ограничительное значение Tmax определяется согласно частоте выборки сигнала временной области в первом звуковом канале, и диапазон поиска попадает в пределы [-Tmax, 0] или диапазон поиска попадает в пределы [0, Tmax]; и

блок обработки, выполненный с возможностью выполнения обработки осуществления поиска в пределах диапазона поиска на основе сигнала частотной области в первом звуковом канале и сигнала частотной области во втором звуковом канале, чтобы определить первый параметр межканальной временной разности ITD, соответствующий первому звуковому каналу и второму звуковому каналу.

7. Устройство по п. 6, при этом блок определения выполнен с возможностью: выполнения обработки перекрестной корреляции в отношении сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, чтобы определить первое значение обработки перекрестной корреляции и второе значение обработки перекрестной корреляции; и определения опорного параметра согласно взаимосвязи значений между первым значением обработки перекрестной корреляции и вторым значением обработки перекрестной корреляции, при этом первое значение обработки перекрестной корреляции является максимальным значением функции, в пределах предварительно заданного диапазона, для функции перекрестной корреляции сигнала временной области в первом звуковом канале относительно сигнала временной области во втором звуковом канале, и второе значение обработки перекрестной корреляции является максимальным значением функции, в пределах предварительно заданного диапазона, для функции перекрестной корреляции сигнала временной области во втором звуковом канале относительно сигнала временной области в первом звуковом канале.

8. Устройство по п. 7, при этом блок определения выполнен с возможностью определения индексного значения, соответствующего большему одному из первого значения обработки перекрестной корреляции и второго значения обработки перекрестной корреляции или противоположному числу индексного значения, как опорного параметра.

9. Устройство по п. 6, при этом блок определения выполнен с возможностью: выполнения обработки обнаружения пика в отношении сигнала временной области в первом звуковом канале и сигнала временной области во втором звуковом канале, чтобы определить первое индексное значение и второе индексное значение; и определения опорного параметра согласно взаимосвязи значений между первым индексным значением и вторым индексным значением, при этом первое индексное значение является индексным значением, соответствующим максимальному значению амплитуды сигнала временной области в первом звуковом канале в пределах предварительно заданного диапазона, и второе индексное значение является индексным значением, соответствующим максимальному значению амплитуды сигнала временной области во втором звуковом канале в пределах предварительно заданного диапазона.

10. Устройство согласно любому из пп. 6-9, при этом блок обработки дополнительно выполнен с возможностью выполнения обработки сглаживания в отношении первого ITD-параметра на основе второго ITD-параметра, при этом первый ITD-параметр является ITD-параметром в первом временном периоде, второй ITD-параметр является сглаженным значением ITD-параметра во втором временном периоде, и второй временной период находится перед первым временным периодом.



 

Похожие патенты:

Изобретение относится к средствам для формирования из представления НОА-сигналов в области коэффициентов смешанного представления упомянутых НОА-сигналов в пространственной области.

Изобретение относится к средствам для сжатия и распаковки представления на основе амбиофонии высшего порядка. Технический результат заключается в повышении эффективности сжатия.

Изобретение относится к средствам для аудиокодирования и аудиодекодирования. Технический результат заключается в повышении эффективности кодирования трехмерных аудиосцен.

Изобретение относится к устройствам, способу и машиночитаемому носителю для воспроизведения звукового объекта. Технический результат заключается в оптимизации воспроизведения звукового объекта.

Изобретение относится к средствам для формирования одного или более аудиоканалов. Технический результат заключается в повышении эффективности кодирования метаданных.

Изобретение относится к средствам для амплитудного панорамирования с затуханием фронтов. Технический результат заключается в повышении эффективности кодирования аудио.

Изобретение относится к средствам для осуществления понижающего микширования SAOC объемного аудиоконтента. Технический результат заключается в повышении эффективности понижающего микширования аудиоконтента.

Изобретение относится к средствам для кодирования аудиосигналов. Технический результат заключается в повышении эффективности кодирования трехмерных аудиосцен.

Изобретение относится к средствам для масштабирования центрального сигнала. Технический результат заключается в повышении разборчивости речи.

Изобретение относится к средствам для формирования из представления НОА-сигналов в области коэффициентов смешанного представления упомянутых НОА-сигналов в пространственной области.
Изобретение относится к технологиям аудиокодирования. Технический результат заключается в повышении эффективности аудиокодирования.

Изобретение относится к области обнаружения речевой активности (VAD). Техническим результатом является уменьшение риска отсечения середины и окончания речевых пакетов путем добавления хвостов сигнала.

Изобретение относится к области аудиокодирования. Технический результат заключается в повышении эффективности аудиокодирования.

Изобретение относится к средствам для аналого-цифрового преобразования аудио. Технический результат заключается в повышении эффективности аналого-цифрового преобразования аудио.

Изобретение относится к средствам для кодирования и декодирования аудиосигнала. Технический результат заключается в повышении эффективности кодирования.

Изобретение относится к средствам кодирования и декодирования аудиосигнала. Технический результат заключается в повышении качества кодированного аудиосигнала.

Изобретение относится к кодированию и декодированию аудиосигнала. Технический результат – обеспечение усовершенствованого принципа аудиокодирования.

Изобретение относится к средствам для кодирования, декодирования и вывода аудиосигнала. Технический результат заключается в повышении качества аудиосигнала.
Наверх