Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями

Авторы патента:

ВИЛЛЕМОЕС Ларс (SE)

G10L21/04 - временное сжатие или расширение

G10L21/038 - Обработка сигналов речи для получения иного слышимого или неслышимого сигнала, например визуального, осязаемого, для того, чтобы модифицировать их качество или их разборчивость (G10L 19/00 имеет преимущество)

G10L21/02 - усиление речи, например подавление шума, нейтрализация эхо-сигнала (подавление эхо-сигнала в громкоговорящих телефонных системах H04M 9/08, в аппаратах для людей с дефектами слуха H04R 15/00)

G10L19/0208 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2671619:

ДОЛБИ ИНТЕРНЕШНЛ АБ (NL)

Изобретение относится к системам кодирования источников звукового сигнала. Технический результат – воспроизведение звукового сигнала с высокой точностью при условии снижения вычислительных затрат. Для этого изобретение предусматривает гармоническое преобразование на основе блока поддиапазонов, где временной блок комплекснозначных дискретных значений поддиапазонов обрабатывается путем общеизвестной модификации фаз. Суперпозиция нескольких модифицированных дискретных значений дает результирующий эффект ограничения нежелательных комбинационных составляющих, посредством чего делается возможным использование более грубой разрешающей способности по частоте и/или меньшей степени передискретизации. В одном из вариантов осуществления изобретения, изобретение дополнительно содержит оконную функцию, пригодную для использования с HFR на основе блока поддиапазонов, усиленной перекрестными произведениями. Аппаратный вариант осуществления изобретения может включать блок (101) анализирующих фильтров, конфигурируемый управляющими данными (104), модуль (102) обработки поддиапазонов и блок (103) синтезирующих фильтров. 3 н. и 12 з.п. ф-лы, 9 ил.

ОБЛАСТЬ ТЕХНИКИ

Настоящее изобретение относится к системам кодирования источников звукового сигнала, которые применяют способ гармонического преобразования для высокочастотной реконструкции (HFR) в процессорах цифровых эффектов, таких как эксайтеры, которые генерируют гармоническое искажение для добавления яркости в обрабатываемый сигнал, и в устройствах растягивания временной шкалы, которые увеличивают длительность сигнала с сохранением спектрального состава.

ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ

В документе WO 98/57436 концепция преобразования была установлена как способ воссоздания высокочастотной полосы из низкочастотной полосы звукового сигнала. Путем использования этой концепции можно получить значительную экономию битовой скорости передачи данных при кодировании звукового сигнала. В системе кодирования звукового сигнала на основе HFR сигнал с низкочастотной полосой пропускания передается в базовый кодер формы сигнала, и более высокие частоты регенерируются с использованием преобразования и дополнительной вспомогательной информации, передаваемой с очень низкой битовой скоростью передачи данных, которая описывает целевую форму спектра на стороне декодера. Для низких битовых скоростей передачи данных, когда полоса пропускания базового кодированного сигнала является узкой, приобретает возрастающую важность воссоздание высокочастотной полосы с приятными для восприятия характеристиками. Гармоническое преобразование, определенное в документе WO №98/57436, очень хорошо выполняется для сложного музыкального материала в ситуации с низкой частотой перехода. Принцип гармонического преобразования заключается в том, что синусоида с частотой ω отображается в синусоиду с частотой Q_ϕω, где Q_ϕ больше 1 - целое число, определяющее порядок преобразования. Для сравнения, HFR на основе модуляции сигнала с одной боковой полосой отображает синусоиду с частотой ω в синусоиду с частотой ω+Δω. где Δω - фиксированный сдвиг частоты. Для любого данного базового сигнала с низкой полосой пропускания, в результате преобразования SSB будет возникать артефакт диссонирующего звона.

С целью достижения наилучшего возможного качества звукового сигнала способы высококачественной гармонической HFR на современном уровне техники используют для достижения требуемого качества звука блоки комплексных модулированных фильтров с очень высокой разрешающей способностью по частоте и высокой степенью передискретизации. Высокая разрешающая способность необходима для того, чтобы избежать нежелательного интермодуляционного искажения, возникающего в результате нелинейной обработки сумм синусоид. При достаточной узости поддиапазонов высококачественные способы стремятся к тому, чтобы в каждом поддиапазоне содержалось не более одной синусоиды. Высокая степень передискретизации по времени необходима для того, чтобы избежать искажений из-за недостаточной частоты дискретизации, а определенная степень передискретизации по частоте необходима для того, чтобы избежать опережающего эха для переходных сигналов. Очевидным недостатком является, то что вычислительная сложность становится при этом очень высокой.

Другой общеизвестный недостаток, связанный с гармоническими преобразованиями, проявляется для сигналов с выраженной периодической структурой. Эти сигналы представляют собой суперпозиции гармонически связанных синусоид с частотами Ω, 2Ω, 3Ω…, где Ω - основная частота. При гармоническом преобразовании порядка Q_ϕ выходные синусоиды имеют частоты Q_ϕΩ, 2Q_ϕΩ, 3Q_ϕΩ…, что в случае Q_ϕ больше 1 представляет собой строгое подмножество желаемого полного гармонического ряда. В отношении результирующего качества звука, как правило, будет восприниматься «паразитный» основной тон, соответствующий преобразованной основной частоте Q_ϕΩ. Часто гармоническое преобразование приводит к «металлическому» характеру звучания кодированного и декодированного звукового сигнала.

В документе WO 2010/081892. который ссылкой включается в настоящее описание, для обращения к решению описанной выше проблемы «паразитного» основного тона в случае высококачественного преобразования был разработан способ перекрестных произведений. Для заданной частичной или полной передаваемой информации о значении основной частоты преобладающей гармонической части сигнала, подлежащего преобразованию с высокой точностью, нелинейные модификации поддиапазонов дополняются нелинейными комбинациями по меньшей мере двух различных анализируемых поддиапазонов, где расстояния между индексами анализируемых поддиапазонов связаны с основной частотой. В результате генерируются недостающие гармоники преобразованного выходного сигнала, что, однако, происходит со значительными вычислительными затратами.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

В виду описанных выше недостатков имеющихся в наличии способов HFR целью настоящего изобретения является создание более эффективной реализации HFR, усиленной перекрестными произведениями. В частности, целью является создание указанного способа, который допускал бы воспроизведение звукового сигнала с высокой точностью при условии снижения вычислительных затрат по сравнению с имеющимися в доступе способами.

Настоящее изобретение достигает, по меньшей мере, одной из этих целей путем создания устройств и способов согласно независимым пунктам формулы изобретения.

В первом аспекте изобретение предусматривает систему, сконфигурированную для генерирования растянутого во времени и/или преобразованного по частоте сигнала из входного сигнала. Система содержит:

- блок анализирующих фильтров, сконфигурированный для получения из входного сигнала некоторого количества Y сигналов анализируемых поддиапазонов, где каждый сигнал анализируемого поддиапазона включает ряд комплекснозначных анализируемых дискретных значений, каждое из которых имеет фазу и амплитуду;

- модуль обработки поддиапазонов, сконфигурированный для определения сигнала синтезируемого поддиапазона исходя из У сигналов анализируемых поддиапазонов с использованием коэффициента Q преобразования поддиапазонов и коэффициента S растягивания поддиапазонов, где по меньшей мере один из коэффициентов Q и S больше единицы, причем модуль обработки поддиапазонов включает:

- экстрактор блоков, сконфигурированный для:

- i) формирования Y кадров, состоящих из L входных дискретных значений, где каждый кадр извлекается из указанного ряда комплекснозначных дискретных значений в сигнале анализируемого поддиапазона, и длина кадра L, больше 1; и

- ii) применения величины скачка блока из h дискретных значений к указанному ряду анализируемых дискретных значений перед формированием следующего кадра, состоящего из L входных дискретных значений, посредством чего генерируется последовательность кадров входных дискретных значений;

- модуль нелинейной обработки кадров, сконфигурированный для генерирования на основе Y соответствующих кадров входных дискретных значений, сформированных в экстракторе блоков, кадра обрабатываемых дискретных значений путем определения фазы и амплитуды для каждого обрабатываемого дискретного значения кадра, где для по меньшей мере одного обрабатываемого дискретного значения:

- i) фаза обрабатываемого дискретного значения основывается на соответствующих фазах соответствующего входного дискретного значения в каждом из Y кадров входных дискретных значений; и

- ii) амплитуда обрабатываемого дискретного значения основывается на амплитуде соответствующего входного дискретного значения в каждом из Y кадров входных дискретных значений; и

- модуль наложения и сложения, сконфигурированный для определения сигнала синтезируемого поддиапазона путем наложения и сложения дискретных значений из последовательности кадров обрабатываемых дискретных значений; и

- блок синтезирующих фильтров, сконфигурированный для генерирования растянутого во времени и/или преобразованного по частоте сигнала из сигнала синтезируемого поддиапазона.

Система может действовать при любом положительном целочисленном значении Y. Однако она действует при, по меньшей мере, Y=2.

Во втором аспекте изобретение предусматривает способ генерирования растянутого во времени и/или преобразованного по частоте сигнала из входного сигнала. Способ включает:

- получение из входного сигнала некоторого количества Y>2 сигналов анализируемых поддиапазонов, где каждый сигнал анализируемого поддиапазона включает ряд комплекснозначных анализируемых дискретных значений, каждое из которых имеет фазу и амплитуду;

- формирование Y кадров, состоящих из L входных дискретных значений, где каждый кадр извлекается из указанного ряда комплекснозначных анализируемых дискретных значений в сигнале анализируемого поддиапазона, и длина кадра L более 1;

- применение величины скачка блока из h дискретных значений к указанному ряду анализируемых дискретных значений перед получением следующего кадра, состоящего из L входных дискретных значений, посредством чего генерируется последовательность кадров входных дискретных значений;

- генерирование на основе Y соответствующих кадров входных дискретных значений кадра обрабатываемых дискретных значений путем определения фазы и амплитуды для каждого обрабатываемого дискретного значения кадра, где для, по меньшей мере, одного обрабатываемого дискретного значения:

- фаза обрабатываемого дискретного значения основывается на соответствующих фазах соответствующего входного дискретного значения по меньшей мере в одном из Y кадров входных дискретных значений; и

- амплитуда обрабатываемого дискретного значения основывается на амплитуде соответствующего входного дискретного значения в каждом из Y кадров входных дискретных значений;

- определение сигнала синтезируемого поддиапазона путем наложения и сложения дискретных значений из последовательности кадров обрабатываемых дискретных значений; и

- генерирование растянутого во времени и/или преобразованного по частоте сигнала из сигнала синтезируемого поддиапазона.

Здесь Y - произвольное целое число больше единицы. Система согласно первому аспекту действует для осуществления способа, по меньшей мере, для Y=2.

Третий аспект изобретения предусматривает компьютерный программный продукт, который включает машиночитаемый носитель данных (или информационный носитель), в памяти которого хранятся команды программного обеспечения, предназначенные для того, чтобы вызывать исполнение программируемым компьютером способа согласно второму аспекту.

Изобретение основывается на понимании того, что общая концепция HFR, усиленной перекрестными произведениями, будет обеспечивать улучшенные результаты тогда, когда обрабатываются данные, упорядоченные в блоки, которые состоят из комплексных дискретных значений поддиапазонов. Помимо прочего, это делает возможным применение к дискретным значениям покадрового сдвига по фазе, что, как было обнаружено, в некоторых ситуациях ослабляет комбинационные составляющие. Также возможно применение регулировки амплитуды, что может приводить к похожим полезным эффектам. Реализация усиленной перекрестными произведениями HFR согласно изобретению включает гармоническое преобразование на основе блока поддиапазонов, что может значительно ослаблять комбинационные составляющие. Поэтому, несмотря на сохранение высокого воспринимаемого качества, может использоваться блок фильтров (такой как блок QMF-фильтров) с более грубой разрешающей способностью по частоте и/или меньшей степенью передискретизации. При обработке на основе блока поддиапазонов временной блок комплексных дискретных значений поддиапазонов обрабатывается путем общеизвестной модификации фаз, а суперпозиция нескольких модифицированных дискретных значений при формировании выходною дискретного значения поддиапазона дает совокупный эффект подавления комбинационных составляющих, которые иначе возникают тогда, когда сигнал входного поддиапазона состоит из нескольких синусоид. Преобразование, основанное на обработке поддиапазона на основе блока, имеет намного меньшую вычислительную сложность, чем у преобразователей с высокой разрешающей способностью, и для многих сигналов достигает почти такого же качества.

Для цели данного раскрытия отметим, что в вариантах осуществления изобретения, где Y>2, модуль нелинейной обработки использует в качестве входного сигнала Y «соответствующих» кадров входных дискретных значений в том смысле, что кадры являются синхронными или почти синхронными. Например, дискретные значения в соответствующих кадрах могут относиться к промежуткам времени, имеющим значительное перекрывание по времени между кадрами. Термин «соответствующие» также используется в отношений дискретных значений для указания того, что они являются синхронными или приблизительно являются таковыми. Кроме того, термин «кадр» будет использоваться взаимозаменяемо с термином «блок». Соответственно, «величина скачка блока» может быть равна длине кадра (возможно, скорректированной в отношении понижающей дискретизации, если она применяется) или может быть меньше длины кадра (возможно, скорректированной в отношении понижающей дискретизации, если она применяется), и в этом случае последовательные кадры накладываются в том смысле, что входное дискретное значение может принадлежать более чем одному кадру. Система необязательно генерирует каждое обрабатываемое дискретное значение в кадре путем определения его фазы и амплитуды на основе фазы и амплитуды всех Y соответствующих кадров входных дискретных значений; без отступления от изобретения система может генерировать фазу и/или амплитуду некоторых обрабатываемых дискретных значений на основе меньшего количества соответствующих входных дискретных значений или на основе только одного входного дискретного значения.

В одном из вариантов осуществления изобретения, блок анализирующих фильтров представляет собой блок квадратурных зеркальных фильтров (QMF), или блок псевдо-QMF, с любым количеством звеньев и точек. Например, он может представлять собой 64-точечный блок QMF. Блок анализирующих фильтров также может выбираться из класса оконных дискретных преобразований Фурье или вейвлет-преобразований. Преимущественно, блок синтезирующих фильтров согласуется с блоком анализирующих фильтров, являясь, соответственно, блоком обратных QMF, блоком обратных псевдо-QMF и т.д. Известно, что указанные блоки фильтров могут обладать достаточно грубой разрешающей способностью по частоте и/или относительно низкой степенью передискретизации. В отличие от текущего уровня техники, изобретение может осуществляться с использованием указанных относительно более простых компонентов, необязательно страдая от понижения качества на выходе; таким образом, указанные варианты осуществления изобретения обладают экономическим преимуществом перед текущим уровнем техники.

В одном из вариантов осуществления изобретения, для блока анализирующих фильтров верно одно или несколько следующих утверждений:

- шаг анализа по времени - Δt_A;

- разнос анализируемых частот - Δf_A;

- блок анализирующих фильтров включает N>1 анализируемых поддиапазонов, индексируемых по индексу анализируемого поддиапазона n=0,…, N-1;

- анализируемый поддиапазон связан с одной из частотных полос входного сигнала.

В одном из вариантов осуществления изобретения, для блока синтезирующих фильтров верно одно или несколько следующих утверждений:

- шаг синтеза по времени - Δt_s;

- разнос синтезируемых частот - Δf_s;

- блок синтезирующих фильтров включает М>1 синтезируемых поддиапазонов, индексируемых по индексу синтезируемого поддиапазона m=0,…, М-1;

- синтезируемый поддиапазон связан с одной из частотных полос сигнала, растянутого во времени и/или преобразованного по частоте.

В одном из вариантов осуществления изобретения, модуль нелинейной обработки кадров адаптирован для ввода двух кадров (Y=2) с целью генерирования одного кадра обрабатываемых дискретных значений, и модуль обработки поддиапазонов включает модуль управления перекрестной обработкой, предназначенный для генерирования данных управления перекрестной обработкой. Определяя количественные и/или качественные характеристики обработки поддиапазонов таким образом, изобретение добивается гибкости и приспособляемости. Управляющие данные могут определять поддиапазоны (например, идентифицируемые по индексам), которые отличаются по частоте от основной частоты входного сигнала. Иными словами, индексы, идентифицирующие поддиапазоны, могут отличаться на целое число, служащее приближением частного указанной основной частоты, деленной на разнос анализируемых частот. Это будет приводить к приятному с психоакустической точки зрения выходному сигналу, поскольку новые спектральные составляющие, генерируемые путем гармонического преобразования, будут совместимы с рядом натуральных гармоник.

В дальнейшем развитии предшествующего варианта осуществления изобретения индексы (входного) анализируемого и (выходного) синтезируемого поддиапазонов выбираются так, чтобы удовлетворялось приводимое ниже уравнение (16). Появляющийся в этом уравнении параметр σ делает его применимым как к неравномерно, так и к равномерно скомпонованным блокам фильтров. Если индексы поддиапазонов получаются как приближенное (например, по методу наименьших квадратов) решение уравнения (16), новая спектральная составляющая, получаемая путем гармонического преобразования, вероятно, будет совместима с рядом натуральных гармоник. Таким образом, HFR, вероятно, будет обеспечивать достоверную реконструкцию оригинального сигнала, из которого было устранено высокочастотное содержимое.

Дальнейшее развитие предшествующего варианта осуществления изобретения предусматривает способ выбора параметра r, появляющегося в уравнении (16), и представления порядка преобразования с перекрестными произведениями. Для заданного индекса m выходного поддиапазона каждое значение порядка r преобразования будет определять два индекса n₁, n₂ анализируемых поддиапазонов. Такое дальнейшее развитие оценивает амплитуды двух указанных поддиапазонов для некоторого количества r вариантов и выбирает то значение, которое дает максимизацию минимальной из двух амплитуд анализируемых поддиапазонов. Такой способ выбора индексов может позволить избежать необходимости в воссоздании достаточной величины амплитуды путем усиления слабых составляющих входного сигнала, что на выходе может приводить к низкому качеству. В этой связи, амплитуды поддиапазонов могут рассчитываться способом, который известен сам по себе, таким как квадратный корень из квадратов входных дискретных значений, образующих кадр (блок) или часть кадра. Амплитуда поддиапазона также может рассчитываться как амплитуда центрального, или ближайшего к центральному, дискретного значения в кадре. Такой расчет может создавать простой, но в то же время адекватный количественный показатель амплитуды.

В дальнейшем развитии предшествующего варианта осуществления изобретения синтезируемый поддиапазон может принимать вклады от событий гармонического преобразования согласно как прямой обработке, так и обработке на основе перекрестных произведений. В этой связи, для определения того, подлежит ли использованию особая возможность восстановления недостающей гармоники путем обработки на основе перекрестных произведений, могут применяться критерии принятия решения. Например, указанное дальнейшее развитие может адаптироваться так, чтобы оно воздерживалось от использования одного модуля перекрестной обработки поддиапазонов в случае, когда выполняется одно из следующих условий:

a) соотношение амплитуды M_s члена анализируемого поддиапазона из прямого источника, приводящего к синтезируемому поддиапазону, и, по меньшей мере, амплитуды М_с в оптимальной паре членов из перекрестного источника, приводящих к синтезируемому поддиапазону, больше предварительно определенной постоянной;

b) синтезируемый поддиапазон уже принимает значительный вклад от модуля прямой обработки;

c) основная частота Ω₀ меньше, чем разнос частот блока анализирующих фильтров Δf_A.

В одном из вариантов осуществления изобретения, изобретение включает понижающую дискретизацию (прореживание) входного сигнала. Более того, один или несколько кадров входных дискретных значений могут определяться путем понижающей дискретизации комплекснозначных дискретных значений в поддиапазоне, которая может выполняться экстрактором блоков.

В дальнейшем развитии предшествующего варианта осуществления изобретения подлежащие применению коэффициенты понижающей дискретизации удовлетворяют приводимому ниже уравнению (15). Равенство нулю обоих коэффициентов понижающей дискретизации не допускается, поскольку это соответствует тривиальному случаю. Уравнение (15) определяет взаимосвязь коэффициентов понижающей дискретизации D₁, D₂ с коэффициентом S растягивания поддиапазонов и коэффициентом Q преобразования поддиапазонов, а также с фазовыми коэффициентами T₁, Т₂, появляющимися в выражении (13) для определения фазы обрабатываемого дискретного значения. Это обеспечивает согласованность фазы обрабатываемых дискретных значений с другими составляющими входного сигнала, добавлению к которым подлежат обрабатываемые дискретные значения.

В одном из вариантов осуществления изобретения, кадры обрабатываемых дискретных значений перед их наложением и сложением подвергаются оконной обработке. Модуль оконной обработки может быть адаптирован для применения к обрабатываемым дискретным значениям оконной функции конечной длины. Подходящие оконные функции перечисляются в прилагаемой формуле изобретения.

Автор изобретения осознал, что способы перекрестных произведений, раскрытые в документе WO №2010/08892 изначально не вполне совместимы со способами обработки на основе блока поддиапазонов. Несмотря на то. что указанный способ может удовлетворительно применяться к одному из дискретных значений в блоке, он может приводить к артефактам наложения спектров, если его напрямую распространить на другие дискретные значения блока. С этой целью, один из вариантов осуществления изобретения применяет оконные функции, включающие оконные дискретные значения, которые, при их взвешивании посредством комплексных весовых коэффициентов и смещении на величину скачка, сводятся к, в значительной мере, постоянной последовательности. Величина скачка может представлять собой произведение величины скачка h блока на коэффициент растягивания поддиапазонов S. Использование указанных оконных функций ослабляет воздействие артефактов наложения спектров. В альтернативном варианте или в дополнение, указанные оконные функции также могут допускать и такие другие меры по ослаблению артефактов, как чередования фаз обрабатываемых дискретных значений.

Предпочтительно, следующие один за другим комплексные весовые коэффициенты, которые применяются к оконным дискретным значениям с целью оценивания их состояния, отличаются только на фиксированное чередование фазы. Также предпочтительно, чтобы указанное фиксированное чередование фазы было пропорционально основной частоте входного сигнала. Чередование фазы также может быть пропорционально подлежащему применению порядку преобразования перекрестных произведений и/или параметру физического преобразования, и/или разности Коэффициентов понижающей дискретизации, и/или шагу анализа по времени. Чередование фазы может иметь вид уравнения (21), по меньшей мере, в приближенном смысле.

В одном из вариантов осуществления изобретения, настоящее изобретение делает возможным гармоническое преобразование, усиленное перекрестными произведениями, путем модификации синтезирующей оконной обработки в ответ на параметр основной частоты.

В одном из вариантов осуществления изобретения, последовательные кадры обрабатываемых дискретных значений складываются с определенным наложением. Для выполнения подходящего наложения кадры обрабатываемых дискретных значений надлежащим образом смещаются на величину скачка, которая представляет собой величину скачка h блока, помноженную на коэффициент S растягивания поддиапазонов. Таким образом, если наложение последовательных кадров входных дискретных значений составляет L-h, то наложение последовательных кадров обрабатываемых дискретных значений может составлять S(L-h).

В одном из вариантов осуществления изобретения, система согласно изобретению действует не только для генерирования обрабатываемого дискретного значения на основе Y=2 входных дискретных значений, но также и на основе только Y=1 дискретного значения. Таким образом, система может восстанавливать недостающие гармоники не только посредством подхода на основе перекрестных произведений (как, например, по уравнению (13)), но также и посредством прямого подхода на основе поддиапазонов (как, например, по уравнению (5) или (11)). Предпочтительно, управляющий модуль сконфигурирован для управления действием системы, в том числе и тем, какой из подходов подлежит использованию для восстановления конкретной недостающей гармоники.

В дальнейшем развитии предшествующего варианта осуществления изобретения система также адаптируется для генерирования обрабатываемого дискретного значения на основе более, чем трех дискретных значений, т.е. для Y≥3. Например, обрабатываемое дискретное значение может быть получено путем вклада в обрабатываемое дискретное значение от нескольких событий гармонического преобразования на основе перекрестных произведений, путем нескольких событий прямой обработки поддиапазонов, или путем сочетания преобразования с перекрестными произведениями и прямого преобразования. Указанная возможность адаптации способа преобразования обеспечивает производительную и многофункциональную HFR. Соответственно, данный вариант осуществления изобретения действует для осуществления способа согласно второму аспекту изобретения для Y=3, 4, 5 и т.п.

Один из вариантов осуществления изобретения сконфигурирован для определения обрабатываемого дискретного значения как комплексного числа, имеющего амплитуду, которая представляет собой среднее значение соответствующих амплитуд соответствующих входных дискретных значений. Указанное среднее значение может представлять собой (взвешенное) арифметическое, (взвешенное) геометрическое или (взвешенное) гармоническое среднее двух или большего количества входных дискретных значений. В случае Y=2 среднее основывается на двух комплексных входных дискретных значениях. Предпочтительно, амплитуда обрабатываемого дискретного значения представляет собой геометрическое средневзвешенное значение. Более предпочтительно, геометрическое значение, как показано в уравнении (13). взвешивается при помощи параметров ρ и 1-ρ. Здесь параметр ρ геометрического взвешивания амплитуд представляет собой действительное число, обратно пропорциональное коэффициенту Q преобразования поддиапазонов. Параметр ρ также может быть обратно пропорционален коэффициенту S растягивания.

В одном из вариантов осуществления изобретения система адаптируется для определения обрабатываемого дискретного значения как комплексного числа, имеющего фазу, которая представляет собой линейную комбинацию соответствующих фаз соответствующих входных дискретных значений в кадрах входных дискретных значений. В частности, линейная комбинация может включать фазы, относящиеся к двум входным дискретным значениям (Y=2). Линейная комбинация двух фаз может применять целочисленные ненулевые коэффициенты, сумма которых равна коэффициенту S растягивания, умноженному на коэффициент Q преобразования поддиапазонов. Факультативно, фаза, полученная путем указанной линейной комбинации, дополнительно корректируется посредством фиксированного параметра коррекции фазы. Фаза обрабатываемого дискретного значения может иметь вид уравнения (13).

В одном из вариантов осуществления изобретения, экстрактор блоков (или аналогичный этап в способе согласно изобретению) адаптируется для интерполяции двух или большего количества анализируемых дискретных значений из сигнала анализируемого поддиапазона с целью получения одного входного дискретного значения, которое будет включено в кадр (блок). Указанная интерполяция может делать возможной понижающую дискретизацию входного сигнала посредством нецелочисленного коэффициента. Анализируемые дискретные значения, подлежащие интерполяции, могут быть или могут не быть следующими друг за другом.

В одном из вариантов осуществления изобретения, конфигурация обработки поддиапазонов может управляться посредством управляющих данных, доставляемых извне модуля, выполняющего обработку. Управляющие данные могут относиться к мгновенным акустическим свойствам входного сигнала. Например, сама система может содержать секцию, адаптированную для определения таких мгновенных акустических свойств сигнала, как (преобладающая) основная частота сигнала. Знание основной частоты обеспечивает руководство при выборе анализируемых поддиапазонов, из которых требуется получить обрабатываемые дискретные значения. Соответственно, разнос анализируемых поддиапазонов пропорционален указанной основной частоте входного сигнала. В качестве альтернативы, управляющие данные также могут доставляться извне системы, предпочтительно, путем включения в формат кодирования, подходящий для передачи в качестве битового потока по сети цифровой связи. В дополнение к управляющим данным указанный формат кодирования может содержать информацию, относящуюся к низкочастотным составляющим сигнала (например, к составляющим в поз. 701 на фиг. 7). Однако в интересах экономии полосы пропускания формат, предпочтительно, не включает полную информацию, относящуюся к высокочастотным составляющим (поз. 702), которые могут восстанавливаться согласно изобретению. Изобретение может, в частности, предусматривать систему декодирования с модулем приема управляющих данных, сконфигурированным для приема указанных управляющих данных, либо включенных в принимаемый битовый поток, который также кодирует входной сигнал, либо принимаемых как отдельный сигнал или битовый поток.

Один из вариантов осуществления изобретения предусматривает способ эффективного осуществления расчетов, обусловленных способом согласно изобретению. С этой целью аппаратная реализация может включать преднормализатор, предназначенный для изменения масштаба амплитуд соответствующих дискретных значений в некоторых из Y кадров, на которых будет основываться кадр обрабатываемых дискретных значений. После указанного изменения масштаба обрабатываемое дискретное значение может быть рассчитано как (взвешенное) комплексное произведение входных дискретных значений, подвергнутых изменению масштаба, и, возможно, не подвергнутых изменению масштаба. Входное дискретное значение, возникающее в произведении как коэффициент с измененным масштабом, обычно повторно не появляется как коэффициент с неизменным масштабом. За исключением, возможно, параметра θ коррекции фазы можно оценить уравнение (13) как произведение комплексных входных дискретных значений (возможно, с измененным масштабом). Это предоставляет вычислительное преимущество по сравнению с обработками амплитуды и фазы обрабатываемого дискретного значения по отдельности.

В одном из вариантов осуществления изобретения система, сконфигурированная для случая Υ=2, содержит два экстрактора блоков, адаптированных для формирования каждым из них одного кадра входных дискретных значений при параллельном действии.

В дальнейшем развитии вариантов осуществления изобретения, представляющих Y≥3, система может содержать ряд блоков обработки поддиапазонов, каждый из которых конфигурируется для определения сигнала промежуточного синтезируемого поддиапазона с использованием отличающегося коэффициента преобразования поддиапазонов и/или отличающегося коэффициента растягивания поддиапазонов, и/или способа преобразования, отличающегося тем, что он является основанным на перекрестном произведении или прямым. Для параллельного действия модули обработки поддиапазонов могут располагаться параллельно. В этом варианте осуществления изобретения система также может включать модуль слияния, расположенный за модулями обработки поддиапазонов и перед блоком синтезирующих фильтров. Модуль слияния может адаптироваться для слияния (например, путем смешивания) соответствующих сигналов промежуточных синтезируемых поддиапазонов с целью получения сигнала синтезируемого поддиапазона. Как уже отмечалось, промежуточный синтезируемый поддиапазон, который подвергается слиянию, может быть получен как путем прямого гармонического преобразования, так и путем преобразования на основе перекрестных произведений. Система согласно этому варианту осуществления изобретения также может содержать базовый декодер, предназначенный для декодирования битового потока во входной сигнал. Она также может включать модуль HFR-обработки, адаптированный для применения информации спектральной полосы, в особенности, путем выполнения формирования спектра. Действие модуля HFR-обработки может управляться информацией, закодированной в битовом потоке.

Один из вариантов осуществления изобретения предусматривает HFR многомерных сигналов, например, в системе. предназначенной для воспроизведения звука в стереофоническом формате, содержащем Ζ каналов, таких как левый, правый, центральный, окружающий и т.д. В одной из возможных реализаций обработки входного сигнала с несколькими каналами обрабатываемые дискретные значения каждого канала основываются на одинаковом количестве входных дискретных значений, хотя коэффициент S растягивания и коэффициент Q преобразования для каждой полосы может варьироваться между каналами. С этой целью реализация может включать блок анализирующих фильтров, предназначенный для генерирования Y сигналов анализируемых поддиапазонов из каждого канала, модуль обработки поддиапазонов, предназначенный для генерирования Ζ сигналов поддиапазонов, и блок синтезирующих фильтров, предназначенный для генерирования Ζ растянутых во времени и/или преобразованных по частоте сигналов, которые образуют выходной сигнал.

В изменениях предшествующего варианта осуществления изобретения выходной сигнал может содержать выходные каналы, которые основываются на различных количествах сигналов анализируемых поддиапазонов. Например, может оказаться целесообразной передача большего количества вычислительных ресурсов к HFR для акустически более выраженных каналов; например, каналам, предназначенным для воспроизведения источниками звука, расположенными перед слушателем, может отдаваться предпочтение перед окружающими или задними каналами.

Следует подчеркнуть, что изобретение относится ко всем сочетаниям приведенных выше характерных признаков, даже если они излагаются в разных пунктах формулы изобретения.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

Настоящее изобретение будет описано ниже посредством иллюстративных примеров, не ограничивающих объем или суть изобретения, со ссылкой на сопроводительные графические материалы.

Фиг. 1 иллюстрирует принцип гармонического преобразования на основе блока поддиапазонов.

Фиг. 2 иллюстрирует действие нелинейной обработки блока поддиапазонов с одним входным поддиапазоном.

Фиг. 3 иллюстрирует действие нелинейной обработки блока поддиапазонов с двумя входными поддиапазонами.

Фиг. 4 иллюстрирует действие гармонического преобразования на основе блока поддиапазонов, усиленного перекрестными произведениями.

Фиг. 5 иллюстрирует пример сценария применения преобразования на основе блока поддиапазонов с использованием нескольких порядков преобразования в аудиокодеке, усиленном HFR.

Фиг. 6 иллюстрирует пример сценария действия преобразования нескольких порядков на основе блока поддиапазонов, применяющего 64-полосный блок анализирующих QMF-фильтров.

Фиг. 7 и 8 иллюстрируют экспериментальные результаты описываемого способа преобразования на основе блока поддиапазонов.

Фиг. 9 показывает детали блока нелинейной обработки согласно фиг. 2, включающего преднормализатор и умножитель.

ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Описываемые ниже варианты осуществления изобретения являются единственно иллюстрациями принципов настоящего изобретения «ГАРМОНИЧЕСКОЕ ПРЕОБРАЗОВАНИЕ НА ОСНОВЕ БЛОКА ПОДДИАПАЗОНОВ, УСИЛЕННОЕ ПЕРЕКРЕСТНЫМИ ПРОИЗВЕДЕНИЯМИ». Следует понимать, что специалистам в данной области будут очевидны модификации и изменения описываемых в данном описании схем и деталей. Поэтому намерение заключается в том, чтобы изобретение ограничивалось только объемом прилагаемой формулы изобретения, а не конкретными деталями, представленными в данном описании с целью описания и разъяснения вариантов осуществления изобретения.

Фиг. 1 иллюстрирует принцип преобразования, растягивания во времени или сочетания преобразования с растягиванием во времени на основе блока поддиапазонов. Входной сигнал во временной области подается в блок 101 анализирующих фильтров, который создает несколько комплекснозначных сигналов поддиапазонов. Эти сигналы подаются в модуль 102 обработки поддиапазонов, на действие которого могут оказывать влияние управляющие данные 104. Каждый выходной поддиапазон может быть получен путем обработки или одного, или двух входных поддиапазонов, или даже как суперпозиция результата для нескольких указанных обрабатываемых поддиапазонов. Множество комплекснозначных выходных поддиапазонов подается в блок 103 синтезирующих фильтров, который, в свою очередь, выводит модифицированный сигнал во временной области. Необязательные управляющие данные 104 описывают конфигурацию и параметры обработки поддиапазонов, которые могут быть адаптированы к сигналу, подлежащему преобразованию. В случае преобразования, усиленного перекрестными произведениями, эти данные могут нести информацию, относящуюся к преобладающей основной частоте.

Фиг. 2 иллюстрирует действие нелинейной обработки блока поддиапазонов с одним входным поддиапазоном. Для данных целевых значений физического растягивания во времени и преобразования, а также физических параметров блоков 101 и 103 анализирующих и синтезирующих фильтров выводятся параметры растягивания во времени и преобразования поддиапазонов, а также индекс исходного поддиапазона для каждого индекса целевого поддиапазона. Тогда целью обработки блока поддиапазонов является реализация соответствующего преобразования, растягивания во времени или сочетания преобразования с растягиванием во времени комплекснозначного сигнала исходного поддиапазона с целью генерирования сигнала целевого поддиапазона.

Экстрактор 201 блоков делает из комплекснозначного входного сигнала выборку конечного кадра, состоящего из дискретных значений. Кадр определяется положением входного указателя и коэффициентом преобразования поддиапазонов. Этот кадр претерпевает нелинейную обработку в секции 202 обработки и затем подвергается оконной обработке окнами конечной и, возможно, переменной длины в секции 203 оконной обработки. Результирующие дискретные значения добавляются к предыдущим выходным дискретным значениям в модуле 204 наложения и сложения, где положение выходного кадра определяется положением выходного указателя. Входной указатель увеличивается на фиксированную величину, и выходной указатель увеличивается на ту же величину, умноженную на коэффициент растягивания поддиапазонов. Повторение данной цепочки операций будет приводить к выходному сигналу с длительностью, которая представляет собой длительность входного сигнала поддиапазона, умноженную на коэффициент растягивания, вплоть до длины окна синтеза, и с комплексными частотами, преобразованными посредством коэффициента преобразования поддиапазонов. Управляющий сигнал 104 может оказывать влияние на каждую из трех секций 201, 202, 203.

Фиг. 3 иллюстрирует действие нелинейной обработки блока поддиапазонов с двумя входными сигналами поддиапазонов. Для заданных целевых значений физического растягивания во времени и преобразования и физических параметров блоков 101 и 103 анализирующих и синтезирующих фильтров выводятся параметры растягивания во времени и преобразования поддиапазонов, а также два индекса исходных поддиапазонов для каждого индекса целевого поддиапазона. В случае, когда нелинейная обработка блока поддиапазонов подлежит использованию для создания недостающих гармоник путем добавления перекрестных произведений, конфигурация секций 301-1, 301-2, 302, 303, а также значения двух индексов исходных поддиапазонов могут зависеть от выходного сигнала 403 модуля 404 управления перекрестной обработкой. Целью обработки блока поддиапазонов является реализация соответствующего преобразования, растягивания во времени или сочетания преобразования с растягиванием во времени для комбинации двух комплекснозначных сигналов исходных поддиапазонов с целью генерирования сигнала целевого поддиапазона. Первый экстрактор 301-1 блоков делает из первого комплекснозначного исходного поддиапазона выборку конечного временного кадра дискретных значений, а второй экстрактор 301-2 блоков делает выборку конечного временного кадра дискретных значений из второго комплекснозначного исходного поддиапазона. Кадры определяются общим положением входного указателя и коэффициентом преобразования поддиапазонов. Оба кадра претерпевают нелинейную обработку в секции 302 и затем подвергаются оконной обработке окном конечной длины в секции 303 оконной обработки. Модуль 204 наложения и сложения может характеризоваться конструкцией, аналогичной или идентичной модулю, представленному на фиг. 2. Повторение данной цепочки операций будет приводить к выходному сигналу с длительностью, равной длительности двух входных сигналов поддиапазонов, умноженной на коэффициент растягивания поддиапазонов (вплоть до длины окна синтеза). В случае, когда оба входных сигнала несут одинаковые частоты, выходной сигнал будет иметь комплексные частоты, преобразованные посредством коэффициента преобразования поддиапазонов. В случае, когда два входных сигнала несут различные частоты, настоящее изобретение указывает, что оконная обработка 303 может быть адаптирована для генерирования выходного сигнала, который имеет целевую частоту, пригодную для генерирования недостающих гармоник в преобразованном сигнале.

Фиг. 4 иллюстрирует принцип усиленного перекрестными произведениями преобразования на основе блока поддиапазонов, растягивания во времени или сочетания преобразования с растягиванием во времени. Модуль 401 прямой обработки поддиапазонов может относится к типу, уже описанному с отсылкой к фиг. 2 (секция 202) или фиг. 3. В модуль 402 перекрестной обработки поддиапазонов также подается множество комплекснозначных сигналов поддиапазонов, и на его действие оказывают влияние данные 403 управления перекрестной обработкой. Модуль 402 перекрестной обработки поддиапазонов выполняет обработку блоков поддиапазонов, относящуюся к типу обработки с двумя входными сигналами поддиапазонов, описанному на фиг. 3, и выходные целевые поддиапазоны добавляются к поддиапазонам из прямой обработки 401 поддиапазонов в сумматоре 405. Данные 403 управления перекрестной обработкой могут изменяться для каждого положения входного указателя и состоят из, по меньшей мере, следующих данных:

- выбранного списка индексов целевых поддиапазонов;

- пары индексов исходных поддиапазонов для каждого выбранного индекса целевого поддиапазона; и

- окна синтеза конечной длины.

Модуль 404 управления перекрестной обработкой доставляет указанные данные 403 управления перекрестной обработкой для заданной части управляющих данных 104, описывающих основную частоту, и множество комплекснозначных выходных сигналов поддиапазонов из блока 101 анализирующих фильтров. Управляющие данные 104 также могут нести другие зависящие от сигнала параметры конфигурации, которые оказывают влияние на обработку перекрестных произведений.

В нижеследующем тексте с отсылкой к фиг. 1-4 и при помощи добавления соответствующей математической терминологии будет дано описание принципов усиленного перекрестными произведениями растягивания во времени и преобразования на основе блока поддиапазонов.

Двумя главными параметрами конфигурации общего гармонического преобразователя и/или устройства растягивания во времени в целом являются:

- S_ϕ - требуемый коэффициент физического растягивания во времени, и

- Q_ϕ - требуемый коэффициент физического преобразования.

Блоки 101, 103 фильтров могут относиться к любому типу модулированных фильтров с комплексной экспонентой, такому как QMF или оконное DFT, или вейвлет-преобразование. Блок 101 анализирующих фильтров и блок 103 синтезирующих фильтров может являться равномерно или неравномерно скомпонованным при модуляции и определяться из широкого диапазона фильтров-прототипов и/или окон. Несмотря на то, что все указанные варианты второго порядка влияют на такие детали при последующем проектировании, как коррекции фаз и управление отображением поддиапазонов, главные проектные параметры системы для обработки поддиапазонов, как правило, получаются из двух частных: Δt_S/Δt_А и Δf_S/Δf_A нижеследующих четырех параметров блоков фильтров, где все параметры измеряются в физических единицах. В приведенных выше частных:

- Δt_A - шаг или сдвиг по времени дискретного значения поддиапазона блока 101 анализирующих фильтров (например, измеряемый в секундах, [с]);

- Δf_A - разнос частот поддиапазонов блока 101 анализирующих фильтров (например, измеряемый в Герцах, [1/с]);

- Δt_S - шаг или сдвиг по времени дискретного значения поддиапазона блока 103 синтезирующих фильтров (например, измеряемый в секундах, [с]); и

- Δf_S - разнос частот поддиапазонов блока 103 синтезирующих фильтров (например, измеряемый в Герцах, [1/с]).

Для конфигурирования модуля 102 обработки поддиапазонов следует рассчитать следующие параметры:

- S - коэффициент растягивания поддиапазонов, т.е. коэффициент растягивания, который применяется в модуле 102 обработки поддиапазонов как соотношение входного и выходного дискретных значений с целью достижения общего физического растягивания во времени сигнала во временной области посредством коэффициента S_ϕ;

- Q - коэффициент преобразования поддиапазонов, т.е. коэффициент преобразования, который применяется в модуле 102 обработки поддиапазонов с целью достижения общего физического преобразования сигнала во временной области посредством коэффициента S_ϕ; и

- соответствие между индексами исходного и целевого поддиапазонов, где n обозначает индекс анализируемого поддиапазона, входящего в модуль 102 обработки поддиапазонов, и m обозначает индекс соответствующего синтезируемого поддиапазона как выходного сигнала модуля 102 обработки поддиапазонов.

С целью определения коэффициента S растягивания поддиапазонов сделано наблюдение, что входной сигнал в блок 101 анализирующих фильтров, имеющий физическую длительность D, соответствует количеству D/Δt_A дискретных значений анализируемых поддиапазонов на входе в модуль 102 обработки поддиапазонов. Эти D/Δt_A дискретных значений будут растягиваться до S⋅D/Δt_A дискретных значений модулем 102 обработки поддиапазонов, который применяет коэффициент S растягивания поддиапазонов. На выходе блока 103 синтезирующих фильтров эти S⋅D/Δt_A дискретных значений приводят к выходному сигналу, имеющему физическую длительность Δt_A⋅S⋅D/Δt_A. Поскольку эта последняя длительность должна соответствовать заданному значению S_ϕ⋅D, т.е. поскольку длительность выходного сигнала во временной области должна быть растянута во времени по сравнению с входным сигналом во временной области посредством коэффициента S_ϕ физического растягивания во времени, получается следующее правило проектирования:

С целью определения коэффициента Q преобразования поддиапазонов, который применяется в модуле 102 обработки поддиапазонов для достижения физического преобразования Q_ϕ, сделано наблюдение, что входная синусоида в блок 101 анализирующих фильтров с физической частотой Ω будет приводить к комплексному сигналу анализируемого поддиапазона с дискретной по времени угловой частотой ω=2πΩ⋅Δt_A, и главный вклад вносится от анализируемого поддиапазона с индексом n≈Ω/Δf_A. Выходная синусоида на выходе блока 103 синтезирующих фильтров с требуемой преобразованной физической частотой Ω_ϕ⋅Ω будет являться результатом подачи на синтезируемый поддиапазон с индексом m≈Ω_ϕ⋅Ω/Δf_s комплексного сигнала поддиапазона с дискретной угловой частотой 2πQ_ϕ⋅Ω⋅Δt_S. В этом контексте, следует проявлять осторожность с тем, чтобы избежать синтеза частот с наложением спектров, отличающихся от Q_ϕ⋅Ω. Как правило, этого можно избежать, делая соответствующие варианты второго порядка так, как это обсуждалось выше, например, путем выбора соответствующих блоков анализирующих и/или синтезирующих фильтров. Дискретная частота 2πQ_ϕ⋅Ω⋅Δt_S на выходе модуля 102 обработки поддиапазонов должна соответствовать дискретной по времени частоте ω=2πQ⋅Δt_A на входе в блок 102 обработки поддиапазонов, умноженной на коэффициент Q преобразования поддиапазонов. Т.е. приравнивая 2πQΩΔt_A к 2πQ_ϕ⋅Ω⋅Δt_S, можно определить следующее соотношение между коэффициентом Q_ϕ физического преобразования и коэффициентом Q преобразования поддиапазонов:

Аналогично, соответствующий индекс n исходного, или анализируемого, поддиапазона модуля 102 обработки поддиапазонов для заданного индекса m целевого, или синтезируемого, поддиапазона должен удовлетворять следующему условию:

В одном из вариантов осуществления изобретения, верно, что Δf_s/Δf_A=Q_ϕ, т.е. разнос частот блока 103 синтезирующих фильтров соответствует разносу частот блока 101 анализирующих фильтров, умноженному на коэффициент физического преобразования, и можно применить взаимнооднозначное отображение индекса анализируемого поддиапазона в индекс синтезируемого поддиапазона n=m. В других вариантах осуществления изобретения отображение индексов поддиапазонов может зависеть от деталей параметров блока фильтров. В частности, если частное разносов частот блока 103 синтезирующих фильтров и блока 101 анализирующих фильтров отличается от коэффициента Q_ϕ физического преобразования, то данному целевому поддиапазону может присваиваться один или два исходных поддиапазона. В случае двух исходных поддиапазонов может оказаться предпочтительным использование двух смежных исходных поддиапазонов с индексами n, n+1, соответственно. То есть первый и второй исходные поддиапазоны имеют вид или (n(m), n(m)+1), или (n(m)+1, n(m)).

Обработка поддиапазонов, представленных на фиг. 2, с единственным исходным поддиапазоном теперь будет описываться как функция параметров S и Q обработки поддиапазонов. Пусть х(k) - входной сигнал в экстрактор 201 блоков, и пусть h - входной шаг блока. Т.е. х(k) - комплекснозначный сигнал анализируемого поддиапазона с индексом n. Блок, извлекаемый экстрактором 201 блоков, можно без потери общности рассматривать как определяемый L=R₁+R₂ дискретными значениями:

где целое число l - индекс подсчета блоков, L - длина блока, и R₁, R₂ - неотрицательные целые числа. Отметим, что для Q=1 блок извлекается из следующих друг за другом дискретных значений, но для Q больше 1 - выполняется понижающая дискретизация таким образом, чтобы входные адреса растягивались посредством коэффициента Q. Если Q - целое число, эта операция, как правило, является выполняемой непосредственно, в то время как для нецелочисленных значений Q может потребоваться интерполяция. Это утверждение также справедливо и для нецелочисленных значений приращения h, т.е. для входного шага блока. В одном из вариантов осуществления изобретения, к комплекснозначному сигналу поддиапазона могут быть применены короткие интерполирующие фильтры, например, фильтры, имеющие два звена фильтра. Например, если требуется дискретное значение с дробным временным индексом k+0,5, достаточное качество может обеспечиваться двухзвенной интерполяцией в форме x(k+0,5)≈ax(k)+bx(k+1), где коэффициенты a, b могут представлять собой постоянные или могут зависеть от индекса поддиапазона (см., например, документы WO №2004/097794 и WO №2007/085275).

Интересным частным случаем формулы (4) является R_i=0, R₂=1, где извлекаемый блок состоит из единственного дискретного значения, т.е. длина блока составляет L=1.

В полярном представлении комплексного числа z=|z| exp(i∠z), где |z| - амплитуда комплексного числа, и ∠z - фаза комплексного числа, модуль 202 нелинейной обработки, генерирующий выходной кадр у₁ из входного кадра х_i преимущественно, определяется коэффициентом модификации фаз T=SQ через:

где ρ∈[0,1] - геометрический весовой параметр амплитуды. Случай ρ=0 соответствует чистой модификации фаз извлекаемого блока. Особенно привлекательным значением взвешивания амплитуды является ρ=1-1/Т, для которого снятие некоторой вычислительной сложности получается независимо от длины блока L, и результирующая переходная характеристика несколько улучшается относительно случая ρ=0. Параметр θ коррекции фазы зависит от деталей блока фильтров, а также индексов исходного и целевого поддиапазонов. В одном из вариантов осуществления изобретения, параметр θ коррекции фазы может определяться экспериментально путем развертки набора входных синусоид. Кроме того, параметр θ коррекции фазы может быть получен путем изучения разности фаз смежных комплексных синусоид целевого поддиапазона или путем оптимизации производительности на входном сигнале типа импульса Дирака. Наконец, при подходящей конструкции блоков 101 и 103 анализирующих и синтезирующих фильтров параметр θ коррекции фазы может быть приравнен нулю или опущен. Коэффициент Т модификации фаз должен быть целым числом с тем. чтобы коэффициенты Т-1 и 1 были целыми числами в линейной комбинации фаз в первой строке формулы (5). При таком допущении, т.е. при допущении, что коэффициент Т модификации фаз является целым числом, результат нелинейной обработки является вполне определенным даже несмотря на то, что фазы являются неоднозначными из-за модуля идентификации 2π.

На словах, формула (5) устанавливает, что фаза дискретного значения выходного кадра определяется смещением фазы соответствующего дискретного значения входного кадра на постоянную величину смещения. Постоянная величина смещения может зависеть от коэффициента Т модификации, который сам по себе зависит от коэффициента растягивания поддиапазонов и/или от коэффициента преобразования поддиапазонов. Кроме того, постоянная величина смещения может зависеть от фазы особого дискретного значения входного кадра из входного кадра. Указанное особое дискретное значение входного кадра сохраняется неизменным для определения фаз всех дискретных значений выходного кадра для данного блока. В случае формулы (5) в качестве фазы особого дискретного значения входного кадра используется фаза центрального дискретного значения входного кадра.

Вторая строка формулы (5) устанавливает, что амплитуда дискретного значения выходного кадра может зависеть от амплитуды соответствующего дискретного значения входного кадра. Кроме того, амплитуда дискретного значения выходного кадра может зависеть от амплитуды особого дискретного значения входного кадра. Данное особое дискретное значение входного кадра может использоваться для определения амплитуды всех дискретных значений выходного кадра. В случае формулы (5), в качестве особого дискретного значения входного кадра используется центральное дискретное значение входного кадра. В одном из вариантов осуществления изобретения, амплитуда дискретного значения выходного кадра может соответствовать геометрическому среднему амплитуды соответствующего дискретного значения входного кадра и особого дискретного значения входного кадра.

В модуле 203 оконной обработки к выходному кадру применяется окно w длины L, что приводит к оконному выходному кадру:

Наконец, предполагается, что все кадры дополняются нулями, и операция 204 наложения и сложения определяется как

где следует отметить, что модуль 204 наложения и сложения применяет шаг блока Sh, т.е. шаг по времени, который в h раз больше, чем шаг h входного блока. По причине указанной разности в шагах по времени по формулам (4) и (7) длительность выходного сигнала z(k) в S раз больше длительности входного сигнала х(к), т.е. сигнал синтезируемого поддиапазона является растянутым посредством коэффициента S растягивания поддиапазонов по сравнению с сигналом анализируемого поддиапазона. Следует отметить, что данное наблюдение, как правило, применимо тогда, когда длина L окна пренебрежимо мала по сравнению с длительностью сигнала.

В случае, когда в качестве входного сигнала обработки 102 поддиапазонов используется комплексная синусоида, т.е. сигнал анализируемого поддиапазона соответствует комплексной синусоиде:

применяя формулы (4)-(7), можно определить, что выходной сигнал обработки 102 поддиапазонов, т.е. соответствующего сигнала синтезируемого поддиапазона, имеет вид:

независимо от ρ. Таким образом, комплексная синусоида с дискретной по времени частотой ω будет преобразовываться в комплексную синусоиду с дискретной по времени частотой Qω при условии, что окно синтеза смещается с шагом Sh, что в сумме для всех k приводит к одной и той же постоянной К:

Для иллюстрации рассмотрим частный случай чистого преобразования, где S=1 и T=Q. Если шаг входного блока h=1 и R₁=0, R₂=1, все вышеуказанное, т.е. формула (5), сокращается до поточечного или основанного на дискретных значениях правила модификации фаз:

Для задания определенных параметров обработки, т.е. длины блока в экстракторах блоков, модуль 102 обработки поддиапазонов может использовать управляющие данные 104.

Ниже описание обработки поддиапазонов будет расширено для охвата случая, представленного на фиг. 3, с двумя входными сигналами поддиапазонов. Пусть х^(l)(k) - сигнал входного поддиапазона в первый экстрактор 301-1 блоков, и пусть х⁽²⁾(k) - сигнал входного поддиапазона во второй экстрактор 301-2 блоков. Каждый экстрактор может использовать отличающийся коэффициент понижающей дискретизации, что приводит к извлекаемым блокам:

Нелинейная обработка 302 генерирует выходной кадр у₁ и может определяться как

обработка в 303 снова описывается формулами (6) и (7), и обработка 204 идентична обработке наложения и сложения, описанной в контексте случая с единственным входным сигналом.

Определение неотрицательных действительных параметров D₁, D₂, ρ, неотрицательных целочисленных параметров Т₁, Т₂ и окна синтеза w теперь зависит от требуемого рабочего режима. Отметим, что если на оба входа подается один и тот же поддиапазон, х⁽¹⁾(k)=х⁽²⁾(k) и D₁=Q, D₂=Q, T₁=1, Т₂=Т-1, то операции по формулам (12) и (13) сокращаются до операций по формулам (3) и (4) в случае единственного входного сигнала.

В одном из вариантов осуществления изобретения, где соотношение разноса Δf_s частот блока 103 синтезирующих фильтров и разноса Δf_A частот блока 101 анализирующих фильтров отличается от требуемого коэффициента Q_ϕ физического преобразования, может оказаться полезным определение дискретных значений синтезируемого поддиапазона с индексом m из двух анализируемых поддиапазонов, соответственно, с индексами n, n+1. Для заданного индекса m соответствующий индекс n может иметь вид целочисленного значения, получаемого путем усечения значения n анализируемого индекса, имеющего вид согласно формуле (3). Один из сигналов анализируемых поддиапазонов, например, сигнал анализируемого поддиапазона, соответствующий индексу n, подается в первый экстрактор 301-1 блоков, а другой сигнал анализируемого поддиапазона, например, сигнал, соответствующий индексу n+1, подается во второй экстрактор 301-2 блоков. На основе указанных двух сигналов анализируемых поддиапазонов путем описанной выше обработки определяется сигнал синтезируемого поддиапазона, соответствующий индексу m. Назначение смежных сигналов анализируемых поддиапазонов двум экстракторам 301-1 и 302-1 блоков может основываться на остатке, который получается при усечении значения индекса по формуле (3), т.е. на разности между точным значением индекса, имеющим вид согласно формуле (3), и усеченным целочисленным значением n, полученным по формуле (3). Если остаток больше 0,5, то сигнал анализируемого поддиапазона, соответствующий индексу n, может назначаться во второй экстрактор 301-2 блоков, в противном случае, этот сигнал анализируемого поддиапазона может назначаться в первый экстрактор 301-1 блоков. В данном рабочем режиме параметры могут проектироваться так, чтобы сигналы входных поддиапазонов совместно использовали одинаковую комплексную частоту ω:

что приводит к сигналу выходного поддиапазона, который представляет собой комплексную синусоиду с дискретной по времени частотой Qω. Оказывается, это происходит в том случае, когда верны следующие соотношения:

Для рабочего режима генерирования недостающих гармоник посредством перекрестных произведений проектные критерии отличаются. Возвращаясь к параметру Q_ϕ физического преобразования, целью добавления перекрестных произведений является генерирование выходного сигнала на частотах Q_ϕΩ+rΩ₀, где r=1,…,Q_ϕ-1, при заданных входных сигналах на частотах Ω и Ω+Ω₀, где Ω₀ - основная частота, принадлежащая к преобладающей составляющей основного тона входного сигнала. Как описывается в документе WO 2010/081892, селективное добавление этих членов будет приводить к заполнению гармонических рядов и значительному ослаблению артефакта паразитного основного тона.

Ниже будет описан конструктивный алгоритм работы управления 404 перекрестной обработкой. Для заданного индекса m целевого выходного поддиапазона, параметра r=1,…,Q_ϕ-1 и основной частоты Ω₀ соответствующие индексы n₁ и n₂ исходных поддиапазонов можно получить путем решения в приближенном смысле следующей системы уравнений:

где σ=1/2 для неравномерно скомпонованной модуляции блока фильтров (которая обычно используется для блоков QMF- и MDCT- фильтров) и σ=0 для равномерно скомпонованной модуляции блока фильтров (которая обычно используется для блоков FFT-фильтров).

Для определений

- p=Ω₀/Δf_A - основная частота, измеряемая в единицах разноса частот блока анализирующих фильтров;

- F=Δf_s/Δf_A - отношение разносов частот синтезируемых и анализируемых поддиапазонов; и

- n^f=((m+σ)F-rp)⋅Q_ϕ - σ - действительнозначный целевой индекс для низшего исходного индекса с целочисленным значением,

пример преимущественного приближенного решения системы уравнений (16) имеет вид выбора n₁ как целого числа, ближайшего к n^f, и n₂ - как целого числа, ближайшего к n^f+р.

Если основная частота меньше, чем разнос частот блока анализирующих фильтров, т.е. если р меньше 1, может оказаться преимущественной отмена добавления перекрестных произведений.

Как указывается в документе WO 2010/081892, перекрестное произведение не следует добавлять к выходному поддиапазону, который уже содержит значительный основной вклад от преобразования без перекрестных произведений. Более того, вклад в перекрестное произведение должен вносить, самое большее, один из случаев r=1,…, Q_ϕ-1. В данном описании эти правила могут осуществляться путем выполнения следующих трех этапов для каждого индекса m целевого выходного поддиапазона:

1. Рассчитать максимальную амплитуду М_с по всем вариантам r=1,…,Q_ϕ-1 минимальной из амплитуд исходных поддиапазонов-кандидатов |x⁽¹⁾| и |x⁽²⁾|, оцененных в центральном кванте времени k=hl (или в его окрестности), где исходные поддиапазоны х⁽¹⁾ и х⁽²⁾ могут иметь вид индексов n₁ и n₂, как в уравнении (16);

2. Рассчитать соответствующую амплитуду M_s для прямого исходного члена |x|, полученного из исходного поддиапазона с индексом n=(F/Q_ϕ)m (ср. уравнение (3));

3. Привести в действие перекрестный член из победившего варианта для М_с на приведенном выше этапе 1 только в том случае, если М_с больше qM_s, где q - предварительно определенная пороговая величина.

В зависимости от конкретных параметров конфигурации системы могут оказаться желательными изменения этой процедуры. Одним из таких изменений является замена жесткого порога на этапе 3 более мягкими правилами, зависящими от частного М_c/М_s. Другое изменение заключается в распространении максимизации на этапе 1 на более чем Q_ϕ-1 вариантов, например, определяемых конечным перечнем значений-кандидатов для основной частоты, измеренных в единицах p разноса анализируемых частот. Еще одно изменение заключается в применении других количественных показателей амплитуд поддиапазонов, таких как амплитуда фиксированного дискретного значения, максимальная амплитуда, средняя амплитуда, амплитуда в смысле l_ϕ-нормы и т.д.

Перечень целевых исходных полос m, выбранных для добавления перекрестного произведения, совместно со значениями n₁ и n₂ составляет основную часть данных 403 управления перекрестной обработкой. Остается описать параметры конфигурации D₁, D₂, ρ, неотрицательные целочисленные параметры T₁, Т₂, появляющиеся при чередовании фаз (13), и окно синтеза w, предназначенное для использования в перекрестной обработке 402 поддиапазонов. Вставка синусоидальной модели в ситуацию с перекрестным произведением приводит к следующим сигналам исходных поддиапазонов:

где ω=2πΩΔt_A и ω₀=2πΩ₀Δt_A. Аналогично, требуемый выходной поддиапазон имеет форму

Вычисления обнаруживают, что данный целевой выходной сигнал можно получить, если выполнить условие (15) совместно с

Условия (15) и (19) эквивалентны следующему выражению:

которое определяет целочисленные коэффициенты T₁, Т₂ для модификации фаз в (13) и предоставляет некоторую свободу в проектировании при задании значений коэффициентов понижающей дискретизации D₁, D₂. Весовой параметр амплитуд преимущественно можно выбрать как ρ=r/Q_ϕ. Как видно, эти параметры конфигурации зависят только от основной частоты Q₀ через выбор r. Однако для того, чтобы было верно уравнение (18), возникает новое условие для окна w синтеза, а именно:

Окно w синтеза, которое или точно, или приблизительно удовлетворяет условию (21), должно предусматриваться в последнем элементе данных 403 управления перекрестной обработкой.

Отметим, что приведенный выше алгоритм для расчета данных 403 управления перекрестной обработкой на основе таких входных параметров, как индекс т целевого выходного поддиапазона и основная частота Ω₀ имеет чисто иллюстративную сущность и, как таковой, не ограничивает объем изобретения. Изменения данного раскрытия в пределах знаний и повседневного опыта специалистов в данной области, например, дополнительный способ обработки на основе блока поддиапазонов, создающий сигнал (18) как выходной сигнал в ответ на входные сигналы (17), полностью подпадают под объем настоящего изобретения.

Фиг. 5 иллюстрирует пример сценария для применения преобразования на основе блока поддиапазонов с использованием нескольких порядков преобразования в аудиокодеке, усиленном HFR. Передаваемый битовый поток принимается базовым декодером 501, который создает декодированный базовый сигнал с низкочастотной полосой пропускания. на частоте дискретизации f_s. Декодированный сигнал с низкочастотной полосой пропускания повторно дискретизируется до выходной частоты дискретизации 2f_s при помощи 32-полосного блока 502 комплексных модулированных анализирующих QMF, за которым следует 64-полосный блок 505 синтезирующих QMF (обратных QMF). Оба блока 502 и 505 фильтров совместно использую) одни и те же физические параметры Δt_s=Δt_A и Δf_s=Δf_A, и модуль 504 HFR-обработки просто пропускает немодифицированные. низкочастотные поддиапазоны, соответствующие базовому сигналу с низкочастотной полосой пропускания. Высокочастотное содержимое выходного сигнала получается путем подачи более высокочастотных поддиапазонов в 64-полосный блок 505 синтезирующих QMF с выходными полосами из модуля 503 многократного преобразователя, подвергания формированию спектра и модификации, выполняемой модулем 504 HFR-обработки. Многократный преобразователь 503 принимает в качестве входного сигнала декодированный базовый сигнал и выводит множество сигналов поддиапазонов, которые представляют 64-полосный анализ суперпозиции, или комбинации нескольких преобразованных составляющих сигнала. Цель заключается в том, чтобы, если HFR-обработка обходится, каждая составляющая соответствовала целочисленному физическому преобразованию без растягивания базового сигнала во времени (Q_ϕ=2, 3…, и S_ϕ=1). В сценарии согласно изобретению сигнал 104 управления преобразователем содержит данные, описывающие основную частоту. Эти данные могут либо передаваться посредством битового потока из соответствующего аудиокодера, либо выводиться путем обнаружения основного тона в декодере, либо получаться из сочетания передаваемой и обнаруживаемой информации.

Фиг. 6 иллюстрирует пример сценария работы преобразования нескольких порядков на основе блока поддиапазонов, применяющего единственный 64-полосный блок анализирующих QMF-фильтров. Здесь генерированию и доставке в область 64-полосного QMF, действующего на частоте дискретизации 2f_s, подлежат три порядка преобразования Q_ϕ=2, 3, 4. Модуль 603 слияния просто выбирает и комбинирует значимые поддиапазоны из ветвей каждого из порядков преобразования в единое множество QMF-поддиапазонов, подлежащих подаче в модуль HFR-обработки. Целью, в особенности, является то, чтобы цепочка обработки, состоящая из 64-полосного QMF-анализа 601, модуля 602-Q_ϕ обработки поддиапазонов и 64-полосного QMF-синтеза 605, приводила к физическому преобразованию с коэффициентом Q_ϕ и S_ϕ=1 (т.е. без растягивания). При идентификации трех указанных блоков посредством 101, 102 и 103 по фиг. 1 обнаруживается, что Δt_A=64fs и Δf_A=fs/128, поэтому Δt_S/Δt_A=1/2 и F=Δf_S/Δf_A=2. Проектирование конкретных параметров конфигурации для 602-Q_ϕ будет описываться для каждого из случаев Q_ϕ=2, 3, 4 отдельно. Для всех случаев шаг анализа выбирается как h=1, и предполагается, что известен нормализованный параметр основной частоты ρ=Ω₀/Δf_A=128Ω₀/f_s.

В первую очередь, рассмотрим случай Q_ϕ=2. В этом случае, 602-2 должен выполнять растягивание поддиапазона с коэффициентом S=2 и преобразование поддиапазона с коэффициентом Q-1 (т.е. не выполнять преобразование), соответствие между исходным n и целевым m поддиапазонами для прямой обработки поддиапазонов имеет вид n=m. В сценарии добавления перекрестного произведения согласно изобретению существует только один тип перекрестных произведений для рассмотрения, а именно: r=1 (см. выше обсуждение после уравнения (15)), и уравнения (20) сокращаются до T₁=T₂=1 и D₁+D₂=1. Пример решения состоит из выбора D₁=0 и D₂=1. В качестве окна синтеза при прямой обработке может использоваться прямоугольное окно четной длины L=10 с R₁=R₂=5, поскольку оно удовлетворяет условию (10). Для окна синтеза при перекрестной обработке может использоваться короткое окно с L=2 звеньев и R₁=R₂=1 для того, чтобы поддерживать дополнительную сложность добавления перекрестных произведений на минимальном уровне. Тем не менее, благоприятный эффект использования длинного блока для обработки поддиапазонов является наиболее значительным в случае сложных звуковых сигналов, где подавляются нежелательные комбинационные члены; в случае преобладающего основного тона, возникновение указанных артефактов менее вероятно. Окно с L=2 звеньев является самым коротким из тех, которые могут удовлетворять условию (10), поскольку h=1 и S=2. Однако, согласно настоящему изобретению, окно преимущественно удовлетворяет условию (21). При имеющихся параметрах это эквивалентно следующему условию:

которое выполняется путем выбора w(0)=1 и w(-1)=exp(iα)=exp(iπp/2).

Для случая Q_ϕ=3 технические условия для 602-3, имеющие вид условий (1)-(3), таковы, что он должен выполнять растягивание поддиапазона S=2, преобразование поддиапазона Q=3/2, и соответствие между исходным n и целевым m поддиапазонами для обработки прямых членов имеет вид n≈2m/3. Существует два типа членов с перекрестным произведением - r=1, 2, - и уравнения (20) сокращаются до

Пример решения состоит из выбора параметров понижающей дискретизации как

- D₁=0 и D₂=3/2 для r=1;

- D₁=3/2 и D₂=0 для r=1.

В качестве окна синтеза при прямой обработке можно использовать прямоугольное окно четной длины L=8 с R₁=R₂=4. В качестве окна обработки перекрестных произведений может использоваться короткое окно с L=2 звеньев и R₁=R₂=1, удовлетворяющее условию

которое выполняется путем выбора w(0)=1 и w(-1)=exp(iα).

В случае Q_ϕ=4 технические условия для 602-4, имеющие вид условий (1)-(3), таковы, что он должен выполнять растягивание поддиапазона с коэффициентом S=2, преобразование поддиапазона с коэффициентом Q=2, и соответствие между исходным n и целевым m поддиапазонами для обработки прямых членов имеет вид n=2m. Существует три типа членов с перекрестным произведением, - r=1, 2, 3, - и уравнения (20) сокращаются до

Пример решения состоит в выборе

- D₁=0 и D₂=2 для r=1;

- D₁=0 и D₂=1 для r=2;

- D₁=2 и D₂=0 для r=3.

В качестве окна синтеза при прямой обработке можно использовать прямоугольное окно четной длины L=6 с R₁=R₂=3. В качестве окна обработки перекрестных произведений может использоваться короткое окно с L=2 звеньев и R₁=R₂=1, удовлетворяющее условию

которое выполняется путем выбора w(0=1) и w(-1)=exp(iα).

В каждом из вышеописанных случаев, где применимо более чем одно значение r, будет происходить выбор, например, аналогично трехэтапной процедуре, описанной перед уравнением (17).

Фиг. 7 изображает амплитудный спектр гармонического сигнала с основной частотой Ω₀=564,7 Гц. Низкочастотная часть 701 сигнала подлежит использованию в качестве входного сигнала для многократного преобразователя. Целью преобразователя является генерирование сигнала, максимально возможно близкого к высокочастотной части 702 входного сигнала, поэтому передача высокочастотной части 702 становится необязательной, и доступная битовая скорость передачи данных может использоваться экономно.

Фиг. 8 изображает амплитудный спектр выходных сигналов из преобразователя, который содержит в качестве входного сигнала низкочастотную часть 701 сигнала, представленного на фиг. 7. Многократный преобразователь конструируется путем использования 64-полосных блоков QMF-фильтров и входной частоты дискретизации f_s=14400 Гц в соответствии с описанием фиг. 5. Однако для ясности рассматривается только два порядка преобразования Q_ϕ=2, 3. Три разные панели 801-803 представляют конечный выходной сигнал, полученный путем использования разных установок данных управления перекрестной обработкой.

Верхняя панель 801 изображает выходной спектр, полученный тогда, когда отменена вся обработка перекрестных произведений, и активна только прямая обработка 401 поддиапазонов. Это будет тот случай, когда управление 404 перекрестной обработкой не принимает основной тон, или р=0. Преобразование посредством Q_ϕ=2 генерирует выходной сигнал в диапазоне 4-8 кГц, а преобразование посредством Q_ϕ=3 генерирует выходной сигнал в диапазоне 8-12 кГц. Как видно, созданные гармоники находятся на большом и возрастающем расстоянии друг от друга, и выходной сигнал существенно отклоняется от целевого высокочастотного сигнала 702. В результирующем выходном звуковом сигнале будут присутствовать слышимые артефакты удвоенного и утроенного «паразитного» основного тона.

Средняя панель 802 изображает выходной спектр, полученный тогда, когда обработка перекрестных произведений активна, используется параметр основного тона р=5 (который служит приближением 128Ω₀/f_s=5,0196), но для перекрестной обработки поддиапазонов используется простое двухзвенное окно синтеза с w(0)=w(-1)=1, удовлетворяющее условию (10). Это эквивалентно непосредственному сочетанию обработки на основе блока поддиапазонов и гармонического преобразования, усиленного перекрестными произведениями. Как видно, дополнительные составляющие выходного сигнала по сравнению с 801 не вполне совпадают с требуемым гармоническим рядом. Это показывает, что при использовании для обработки перекрестных произведений процедуры, унаследованной от прямой обработки поддиапазонов, обработка приводит к недостаточному для использования качеству звука.

Нижняя панель 803 изображает выходной спектр, полученный по тому же сценарию, что и для средней панели 802. но, в данном случае, с окнами синтеза при перекрестной обработке поддиапазонов, имеющими вид формул, описанных в случае Q_ϕ=2,3 согласно фиг. 5, то есть: двухзвенного окна синтеза в форме w(0)=1 и w(-1)=exp(iα), удовлетворяющего условию (21), и с указываемым настоящим изобретением характерным признаком, который заключается в том, что оно зависит от р. Как видно, комбинированный выходной сигнал очень хорошо совпадает с требуемым гармоническим рядом 702.

Фиг. 9 показывает участок нелинейной обработки модуля 202 обработки кадров, включающий секции, сконфигурированные для приема двух входных дискретных значений u₁, u₂ и для генерирования на их основе обрабатываемого дискретного значения w, амплитуда которого имеет вид геометрического среднего амплитуд входных значений, и фаза которого представляет собой линейную комбинацию фаз входных дискретных значений, т.е.:

Согласно данному описанию, обрабатываемое значение w можно получить путем предварительной нормализации каждого из дискретных значений u₁, u₂ в соответствующем преднормализаторе 901, 902 и умножения предварительно нормализованных входных дискретных значений ν₁=u₁/|u₁|^a, ν₂=u₂/|n₂|^b во взвешенном умножителе 910, который выводит w=v₁^αv₂^β. Ясно, что действие преднормализаторов 901, 902 и взвешенного умножителя 910 определяется входными параметрами а, b, α и β. Легко удостовериться, что уравнения (22) будут выполняться, если α=Т₁, β=Τ₂, а=1-ρ/Т₁, b=1-(1-ρ)/Т₂. Специалисты легко обобщат эту схему на произвольное количество N₀ входных дискретных значений, где на умножитель подается N₀ входных дискретных значений, некоторые или все из которых были подвергнуты нормализации. Затем можно будет обнаружить, что общая предварительная нормализация (а=b в предположении, что преднормализаторы 901, 902 генерируют одинаковые результаты) возможна, если ρ приравнять к ρ=T₁/(T₁+T₂). Это приводит к вычислительному преимуществу тогда, когда рассматривается большое количество поддиапазонов, поскольку на всех поддиапазонах-кандидатах перед умножением может выполняться общий этап предварительной нормализации. В преимущественной аппаратной реализации ряд одинаково функционирующих преднормализаторов заменяется на единый модуль, который чередуется между дискретными значениями из разных поддиапазонов с разделением по времени.

Дальнейшие варианты осуществления настоящего изобретения станут очевидны специалистам в данной области после прочтения приведенного выше описания. И хотя настоящее описание и графические материалы раскрывают варианты и примеры осуществления изобретения, изобретение не ограничивается данными конкретными примерами. Многочисленные модификации и изменения могут быть сделаны без отступления от объема настоящего изобретения, который определяется сопроводительной формулой изобретения.

Раскрытые выше в данном описании системы и способы могут реализовываться как программное обеспечение, встроенное программное обеспечение, аппаратное обеспечение или их комбинация. Некоторые компоненты или все компоненты могут реализовываться как программное обеспечение, исполняемое процессором цифровой обработки сигналов или микропроцессором, или они могут реализовываться как аппаратное обеспечение или как интегральная микросхема специального назначения. Указанное программное обеспечение может распространяться на машиночитаемых носителях данных, которые могут включать компьютерные носители данных (или непреходящие носители) и средства связи (преходящие носители). Как хорошо известно специалистам в данной области, компьютерные носители данных включают энергозависимые и энергонезависимые, съемные и несъемные носители, реализованные посредством любого способа или технологии хранения информации, такой как машиночитаемые команды, структуры данных, программные модули или другие данные. Компьютерные носители данных включают в качестве неограничивающих примеров RAM, ROM, EEPROM, флэш-память или другую технологию памяти, CD-ROM, компакт-диски формата DVD или другой оптический дисковый носитель, магнитные кассеты, магнитную ленту, магнитные дисковые носители или другие магнитные запоминающие устройства, или любой другой носитель данных, который может быть использован для хранения требуемой информации и для доступа компьютера к ней. Как также хорошо известно специалистам в данной области, средства связи, как правило, включают машиночитаемые команды, структуры данных, программные модули или другие данные в модулированном сигнале данных, таком как несущая волна или другой механизм передачи, и включает любые средства доставки информации.

1. Система, сконфигурированная для генерирования растянутого во времени и/или преобразованного по частоте сигнала из входного сигнала, причем система содержит:

блок (101) анализирующих фильтров, сконфигурированный для получения некоторого количества Y≥1 сигналов анализируемых поддиапазонов из входного сигнала, где каждый сигнал анализируемого поддиапазона включает ряд комплекснозначных анализируемых дискретных значений, каждое из которых имеет фазу и амплитуду;

модуль (102) обработки поддиапазонов, сконфигурированный для генерирования сигнала синтезируемого поддиапазона из Y сигналов анализируемых поддиапазонов с использованием коэффициента Q преобразования поддиапазонов и коэффициента S растягивания поддиапазонов, причем по меньшей мере один из коэффициентов Q и S больше единицы, где модуль (102) обработки поддиапазонов содержит:

экстрактор (201) блоков, сконфигурированный для каждого из Y сигналов анализируемых поддиапазонов для:

i) формирования кадра, состоящего из L входных дискретных значений, извлекаемого из указанного ряда комплекснозначных анализируемых дискретных значений в сигнале анализируемого поддиапазона, и длина кадра составляет L>1; и

ii) применения величины скачка блока из h дискретных значений к указанному ряду анализируемых дискретных значений перед формированием следующего кадра, состоящего из L входных дискретных значений:

модуль (202) нелинейной обработки кадров, сконфигурированный для генерирования на основе Y соответствующих кадров входных дискретных значений, сформированных экстрактором блоков, кадра обрабатываемых

дискретных значений путем определения фазы и амплитуды для каждого обрабатываемого дискретного значения кадра, где для по меньшей мере одного обрабатываемого дискретного значения:

i) фаза обрабатываемого дискретного значения основывается на соответствующих фазах соответствующего входного дискретного значения в каждом из Y кадров входных дискретных значений; и

ii) амплитуда обрабатываемого дискретного значения основывается на амплитуде соответствующего входного дискретного значения в каждом из Y кадров входных дискретных значений;

модуль (203) оконной обработки, сконфигурированный для применения к кадру обрабатываемых дискретных значений оконной функции конечной длины, содержащей ряд оконных дискретных значений, причем наложенные и сложенные оконные дискретные значения ряда оконных функций при взвешивании посредством комплексных весовых коэффициентов и сдвиге на величину скачка Sh образуют, в значительной мере, постоянную последовательность; и

модуль (204) сложения и наложения, сконфигурированный для определения сигнала синтезируемого поддиапазона путем наложения и сложения дискретных значений из последовательности кадров обрабатываемых дискретных значений, подвергаемых оконной обработке;

блок (103) синтезирующих фильтров, сконфигурированный для генерирования растянутого во времени и/или преобразованного по частоте сигнала из по меньшей мере выходного сигнала синтезируемого поддиапазона посредством модуля обработки поддиапазонов,

где система действует, по меньшей мере, при Y=2.

2. Система по п. 1, отличающаяся тем, что

блок (101) анализирующих фильтров представляет собой один из следующего: блока квадратурных зеркальных фильтров, оконного дискретного преобразования Фурье или вейвлет-преобразования; и

блок (103) синтезирующих фильтров представляет собой блок соответствующих обратных фильтров или обратное преобразование.

3. Система по любому из предыдущих пунктов, отличающаяся тем, что блок (101) анализирующих фильтров применяет к входному сигналу шаг анализа по времени - Δt_A;

блок анализирующих фильтров имеет разнос анализируемых частот - Δf_A;

блок анализирующих фильтров содержит количество N анализируемых поддиапазонов, причем N>1, где n - индекс анализируемого поддиапазона, n=0…N-1;

анализируемый поддиапазон из числа N анализируемых поддиапазонов связан с частотной полосой входного сигнала;

блок (103) синтезирующих фильтров применяет к сигналу синтезируемого поддиапазона шаг синтеза по времени - Δt_s;

блок синтезирующих фильтров имеет разнос синтезируемых частот - Δf_s;

блок синтезирующих фильтров содержит количество М синтезируемых поддиапазонов, причем М>1, где m - индекс синтезируемого поддиапазона, причем m=0, …, М-1; и

синтезируемый поддиапазон из числа М синтезируемых поддиапазонов связан с одной из частотных полос растянутого во времени и/или преобразованного по частоте сигнала.

4. Система по п. 3, отличающаяся тем. что модуль (102) обработки поддиапазонов сконфигурирован для Y=2 и дополнительно содержит модуль

(404) управления перекрестной обработкой, сконфигурированный для генерирования данных (403) управления перекрестной обработкой, определяющих индексы n₁, n₂ поддиапазонов, связанные с сигналами анализируемых поддиапазонов и с индексом m синтезируемого поддиапазона, где указанные индексы соотносятся как приближенные целочисленные решения системы уравнений

где Ω₀ - основная частота входного сигнала;

σ=0 или ½;

Q=(Δt_S/Δt_A)⋅Qϕ,

Q_ϕ - коэффициент преобразования

r - целое число, удовлетворяющее неравенству 1≤r≤Q_ϕ-1.

5. Система по п. 4, отличающаяся тем, что модуль (404) управления перекрестной обработкой сконфигурирован для генерирования управляющих данных обработки так, чтобы индексы n₁, n₂ поддиапазонов основывались на значении r, которое максимизирует минимальную из амплитуд поддиапазонов двух кадров, сформированных путем извлечения анализируемых дискретных значений из сигналов анализируемых поддиапазонов.

6. Система по п. 5, отличающаяся тем, что амплитуда поддиапазона для каждого кадра, состоящего из L входных дискретных значений, представляет собой амплитуду центрального или ближайшего к центральному дискретного значения.

7. Система по пп. 1 или 2, отличающаяся тем, что экстрактор (201) блоков сконфигурирован для получения, по меньшей мере, одного кадра входных дискретных значений путем понижающей дискретизации комплекснозначных анализируемых дискретных значений в сигнале анализируемого поддиапазона.

8. Система по п. 7, отличающаяся тем, что сконфигурирована для Y=2, где экстрактор блоков сконфигурирован для получения первого и второго кадров входных дискретных значений путем понижающей дискретизации комплекснозначных анализируемых дискретных значений, соответственно, в первом и втором сигналах анализируемых поддиапазонов посредством коэффициентов D₁ и D₂ понижающей дискретизации, удовлетворяющих

и неравенству D₁≥0, D₂>0 или D₁>0, D₂≥0,

и модуль (202) нелинейной обработки кадров сконфигурирован для определения фазы обрабатываемого дискретного значения на основе линейной комбинации с неотрицательными целочисленными коэффициентами Т₁, Т₂ соответствующих фаз соответствующего входного дискретного значения в первом и втором кадрах входных дискретных значений.

9. Система по пп. 1 или 2, отличающаяся тем, что следующие друг за другом комплексные весовые коэффициенты отличаются только на фиксированное чередование фаз, причем чередование фаз пропорционально основной частоте входного сигнала.

10. Система по пп. 1 или 2, отличающаяся тем, что модуль (204) наложения и сложения применяет величину скачка к следующим друг за другом кадрам обрабатываемых дискретных значений, причем величина скачка равна величине h скачка блока, умноженной на коэффициент S растягивания поддиапазонов.

11. Система по пп. 1 или 2, отличающаяся тем, что сконфигурирована для Y=2, причем модуль (202) обработки кадров сконфигурирован для определения амплитуды обрабатываемого дискретного значения как среднего значения амплитуды соответствующего входного дискретного значения в первом кадре входных дискретных значений и амплитуды соответствующего входного дискретного значения во втором кадре входных дискретных значений и/или для определения фазы обрабатываемого дискретного значения на основе линейной комбинации с неотрицательными целочисленными коэффициентами (T₁, Т₂) соответствующих фаз соответствующего входного дискретного значения в первом и втором кадрах входных дискретных значений.

12. Система по пп. 1 или 2, отличающаяся тем. что дополнительно содержит:

ряд модулей (401, 402; 503; 602-2, 602-3, 602-4) обработки поддиапазонов, каждый из которых сконфигурирован для определения сигнала промежуточного синтезируемого поддиапазона с использованием отличающегося значения коэффициента Q преобразования поддиапазонов и/или коэффициента S растягивания поддиапазонов; и

модуль (405; 603) слияния, расположенный за указанным рядом модулей обработки поддиапазонов и перед блоком (103) синтезирующих фильтров, сконфигурированный для слияния соответствующих сигналов промежуточных синтезируемых поддиапазонов с целью определения сигнала синтезируемого поддиапазона.

13. Система по пп. 1 или 2, отличающаяся тем, что

блок (101) анализирующих фильтров сконфигурирован для формирования Y×Z анализируемых поддиапазонов из входного сигнала;

модуль (102) обработки поддиапазонов сконфигурирован для генерирования Z сигналов синтезируемых поддиапазонов из Y×Z сигналов анализируемых поддиапазонов, применяя пару величин S и Q для каждой группы из Y сигналов анализируемых поддиапазонов, на которой основывается один сигнал синтезируемого поддиапазона; и

блок (103) синтезирующих фильтров сконфигурирован для генерирования Z растянутых во времени и/или преобразованных по частоте сигналов из Z сигналов синтезируемых поддиапазонов.

14. Способ генерирования растянутого во времени и/или преобразованного по частоте сигнала из входного сигнала, причем способ включает этапы, на которых:

получают число Y≥2 сигналов анализируемых поддиапазонов из входного сигнала, причем каждый сигнал анализируемого поддиапазона включает ряд комплекснозначных анализируемых дискретных значений, каждое из которых имеет фазу и амплитуду;

для каждого из Y анализируемых поддипазонов:

формируют кадр, состоящий из L входных дискретных значений, причем кадр извлекают из указанного ряда комплекснозначных анализируемых дискретных значений в сигнале анализируемого поддиапазона, а длина кадра составляет L>1; и

применяют величину скачка блока из h дискретных значений к указанному ряду анализируемых дискретных значений перед получением следующего кадра, состоящего из L входных дискретных значений;

генерируют на основе Y соответствующих кадров полученных таким образом входных дискретных значений кадр обрабатываемых дискретных значений путем определения фазы и амплитуды для каждого обрабатываемого дискретного значения кадра, где по меньшей мере для одного обрабатываемого дискретного значения:

i) фаза обрабатываемого дискретного значения основывается на соответствующих фазах соответствующего входного дискретного значения в Y кадрах входных дискретных значений; и

ii) амплитуда обрабатываемого значения основывается на амплитуде соответствующего входного дискретного значения в Y кадрах входных дискретных значений;

определяют сигнал синтезируемого поддиапазона путем применения оконной функции конечной длины к каждому кадру обработанных дискретных значений, затем накладывают и складывают дискретные значения последовательности, причем оконная функция содержит ряд оконных дискретных значений, причем наложенные и сложенные оконные дискретные значения ряда оконных функций при взвешивании посредством комплексных весовых коэффициентов и сдвиге на величину скачка Sh образуют, в значительной мере, постоянную последовательность; и

генерируют растянутый во времени и/или преобразованный по частоте сигнал из, по меньшей мере, сигнала синтезируемого поддиапазона.

15. Носитель данных, в памяти которого хранятся машиночитаемые команды, предназначенные для выполнения способа по п. 14.

Изобретение относится к средствам для кодирования и декодирования аудио. Технический результат заключается в повышении эффективности кодирования и декодирования.

Преобразователь масштаба времени, аудио декодер, способ и компьютерная программа, использующие управление качеством // 2662683

Изобретение относится к области кодирования и декодирования аудиосигналов. Технический результат – повышение качества звучания масштабированной по времени версии входного аудиосигнала.

Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы // 2621965

Изобретение относится к средствам кодирования/декодирования звукового сигнала. Технический результат заключается в повышении эффективности кодирования/декодирования звукового сигнала, имеющего гармоническое или речевое содержание.

Декодер звукового сигнала, кодирующее устройство звукового сигнала, способ декодирования звукового сигнала, способ кодирования звукового сигналя и компьютерная программа, использующая зависящую от высоты звука адаптацию кодируемого контекста // 2607264

Изобретение относится к средствам кодирования и декодирования звукового сигнала. Технический результат заключается в повышении эффективности кодирования при наличии колебаний основной частоты.

Устройство обработки сигналов, способ и программа // 2604338

Изобретение относится к устройству обработки сигналов. Техническим результатом является возможность получать звук с более высоким качеством при декодировании аудиосигнала.

Устройство и метод для обработки аудио сигнала, содержащего переходный сигнал // 2598326

Изобретение относится к средствам обработки аудио сигнала с переходом. Технический результат заключается в .улучшении качества аудио сигнала.

Устройство и способ кодирования, устройство и способ декодирования и программа // 2595544

Изобретение относится к средствам кодирования и декодирования звука. Технический результат заключается в повышении четкости аудиосигнала, получаемого в результате декодирования.

Устройство и способ обработки переходных процессов для аудио сигналов с изменением скорости воспроизведения или высоты тона // 2591012

Изобретение относится к средствам для обработки аудио сигнала. Технический результат заключается в уменьшении влияния переходных процессов на качество звука.

Устройство и способ кодирования, устройство и способ декодирования и программа // 2589293

Изобретение относится к средствам кодирования и декодирования аудиосигналов. Технический результат заключается в повышении качества звучания кодированного звукового сигнала.

Способ расширения ширины полосы, устройство расширения ширины полосы, программа, интегральная схема и устройство декодирования аудио // 2582061

Изобретение относится к средствам расширения ширины полосы. Технический результат заключается в обеспечении возможности уменьшения объема вычислений при расширении ширины полосы и подавления ухудшения качества в ширине полосы, которая должна быть расширена.

Кодер и декодер аудиосигнала, использующие процессор частотной области, процессор временной области и кросспроцессор для непрерывной инициализации // 2668397

Изобретение относится к кодированию и декодированию аудиосигнала. Технический результат – обеспечение усовершенствованого принципа аудиокодирования.

Способ и устройство вывода аудиосигнала, способ и устройство кодирования, способ и устройство декодирования и программа // 2668113

Изобретение относится к средствам для кодирования, декодирования и вывода аудиосигнала. Технический результат заключается в повышении качества аудиосигнала.

Оптимизированный масштабный коэффициент для расширения диапазона частот в декодере сигналов звуковой частоты // 2668058

Изобретение относится к средствам для расширения диапазона частот при декодировании аудиосигналов. Технический результат заключается в повышении эффективности расширения диапазона частот без дополнительной информации из кодера.

Способы и системы переключения технологий кодирования в устройстве // 2667973

Изобретение относится к средствам для переключения технологии кодирования при кодировании аудиосигнала. Технический результат заключается в сокращении артефактов на границах кадров и несогласованностей энергии при переключении технологии кодирования.

Генерация сигнала верхней полосы // 2667460

Изобретение относится к средствам для генерации сигнала верхней полосы. Технический результат заключается в повышении эффективности кодирования.

Устройство и способ формирования расширенного сигнала с использованием заполнения независимым шумом // 2667376

Изобретение относится к обработке аудиосигнала. Технический результат – обеспечение формирования расширенного сигнала из входного сигнала.

Способ и устройство для обработки потери кадра // 2666471

Изобретение относится к средствам для обработки потери кадра. Технический результат заключается в повышении качества восстановленного после потери кадра аудиосигнала.

Расширение полосы пропускания аудио посредством вставки шума с предварительно приданной формой по времени в частотной области // 2666468

Изобретение относится к средствам для расширения полосы пропускания аудио посредством вставки шума. Технический результат заключается в повышении эффективности расширения полосы пропускания.

Аудио декодер, аудио кодер, способ обеспечения по меньшей мере четырех канальных аудио сигналов на основе кодированного представления, способ обеспечения кодированного представления на основе по меньшей мере четырех канальных аудио сигналов и компьютерная программа, использующие расширение диапазона // 2666230

Изобретение относится к средствам для кодирования и декодирования аудио. Технический результат заключается в повышении эффективности кодирования и декодирования трехмерных аудио сцен.

Оценивание фонового шума в аудиосигналах // 2665916

Изобретение относится к средствам для оценивания фонового шума в аудиосигнале. Технический результат заключается в повышении точности оценивания, содержит ли аудиосигнал активную речь или музыку или нет.

Способ и устройство для обнаружения голосовой активности // 2670785

Изобретение относится к области обнаружения речевой активности (VAD). Техническим результатом является уменьшение риска отсечения середины и окончания речевых пакетов путем добавления хвостов сигнала.