Оценка формы коэффициента передачи для улучшенного отслеживания временных характеристик верхнего диапазона

Изобретение относится к области обработки сигналов. Технический результат изобретения заключается в обеспечении возможности настройки коэффициента передачи во время воспроизведения звукового сигнала из закодированной версии звукового сигнала. Способ включает в себя определение в устройстве кодирования речи первых параметров формы коэффициента передачи на основании гармонически расширенного сигнала и/или на основании остаточного сигнала верхнего диапазона, ассоциированного с высокочастотной частью звукового сигнала. Способ также включает в себя определение вторых параметров формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и на основании части верхнего диапазона звукового сигнала. Способ также включает в себя вставку первых параметров формы коэффициента передачи и вторых параметров формы коэффициента передачи в закодированную версию звукового сигнала. 4 н. и 26 з.п. ф-лы, 7 ил.

 

ЗАЯВЛЕНИЕ ОБ УСТАНОВЛЕНИИ ПРИОРИТЕТА

По настоящей заявке испрашивается приоритет предварительной заявки на патент США № 61/889434, озаглавленной «GAIN SHAPE ESTIMATION FOR IMPROVED TRACKING OF HIGH-BAND TEMPORAL CHARACTERISTICS», зарегистрированной 10 октября 2013 и обычной заявки на патент США № 14/508486, озаглавленной «GAIN SHAPE ESTIMATION FOR IMPROVED TRACKING OF HIGH-BAND TEMPORAL CHARACTERISTICS», зарегистрированной 7 октября 2014, содержание которых включено посредством ссылки во всей их полноте.

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее раскрытие в широком смысле относится к обработке сигналов.

ОПИСАНИЕ УРОВНЯ ТЕХНИКИ

Успехи в технологии позволили получить меньшие по размеру и более мощные вычислительные устройства. Например, в настоящий момент существует множество портативных вычислительных устройств, включая беспроводные вычислительные устройства, такие как мобильные беспроводные телефоны, карманные персональные компьютеры (КПК) и радиоприемники персонального вызова, которые являются небольшими по размеру, легкими и могут легко переноситься пользователями. Более конкретно, портативные беспроводные телефоны, такие как сотовые телефоны и телефоны, работающие по Интернет-протоколу (IP), могут передавать голос и пакеты данных по беспроводным сетям. Кроме того, многие такие беспроводные телефоны содержат устройства других типов, которые встроены в них. Например, беспроводной телефон может также содержать цифровую фотокамеру, цифровую видеокамеру, цифровое записывающее устройство и проигрыватель аудиофайлов.

В традиционных телефонных системах (например, коммутируемых телефонных сетях общего пользования (PSTN)) ширина спектра сигнала ограничена частотным диапазоном от 300 герц (Гц) до 3,4 килогерц (кГц). В широкополосных (WB) приложениях, таких как сотовая телефония и передача речи по протоколу IP (VoIP), ширина спектра сигнала может перекрывать частотный диапазон от 50 Гц до 7 кГц. В сверхширокополосных методиках кодирования (SWB) поддерживается ширина спектра, которая простирается приблизительно до 16 кГц. Расширение ширины спектра сигнала от узкополосной телефонии в 3,4 кГц до телефонии SWB в 16 кГц может улучшить качество восстановления сигнала, повысить разборчивость и естественность.

Методики кодирования SWB обычно включают в себя кодирование низкочастотной части сигнала (например, от 50 Гц до 7 кГц, также называемой "нижним диапазоном"). Например, нижний диапазон может быть представлен с применением параметров фильтрации и/или сигнала возбуждения нижнего диапазона. Однако, в целях повышения эффективности кодирования высокочастотная часть сигнала (например, от 7 кГц до 16 кГц, также называемая "верхним диапазоном"), может кодироваться и передаваться не полностью. Вместо этого в приемнике может применяться моделирование сигнала для предсказания верхнего диапазона. В некоторых реализациях данные, относящиеся к верхнему диапазону, могут быть предоставлены приемнику для помощи в предсказании. Такие данные могут называться «дополнительной информацией» и могут включать в себя информацию коэффициенте передачи, линейные спектральные частоты (LSF, также называемые линейными спектральными парами (LSP)), и т.д. Свойства сигнала нижнего диапазона могут использоваться для генерации дополнительной информации; однако, энергетические несоответствия между нижним диапазоном и верхним диапазоном могут привести к тому, что дополнительная информация будет неточно характеризовать верхний диапазон.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Раскрыты системы и способы для выполнения двухэтапной оценки формы коэффициента передачи для улучшенного отслеживания временных характеристик верхнего диапазона. Устройство кодирования речи может использовать часть нижнего диапазона (например, гармонически расширенное возбуждение нижнего диапазона) звукового сигнала для генерации информации (например, дополнительной информации), используемой для восстановления высокочастотной части звукового сигнала в декодирующем устройстве. Первый блок оценки формы коэффициента передачи может определять изменения энергии в остаточном сигнале верхнего диапазона, которые не присутствуют в возбуждении гармонически расширенного нижнего диапазона. Например, блок оценки формы коэффициента передачи может оценивать временные изменения или отклонения (например, энергетические уровни) в верхнем диапазоне, которые являются сдвинутыми или отсутствуют в остаточном сигнале верхнего диапазона относительно гармонически расширенного сигнала возбуждения нижнего диапазона. Первый блок настройки формы коэффициента передачи (на основании первых параметров формы коэффициента передачи) может настроить изменение во времени гармонически расширенного возбуждения нижнего диапазона таким образом, чтобы оно близко соответствовало временной огибающей остаточного сигнала верхнего диапазона. Синтезированный сигнал верхнего диапазона может генерироваться на основании настроенного/измененного гармонически расширенного возбуждения нижнего диапазона, и второй блок оценки формы коэффициента передачи может определять изменения энергии между синтезированным сигналом верхнего диапазона и высокочастотной частью звукового сигнала на втором этапе. Синтезированный сигнал верхнего диапазона может быть настроен таким образом, чтобы смоделировать высокочастотную часть звукового сигнала на основании данных (например, вторых параметров формы коэффициента передачи) второго блока оценки формы коэффициента передачи. Первые параметры формы коэффициента передачи и вторые параметры формы коэффициента передачи могут быть переданы декодирующему устройству вместе с другой дополнительной информацией в целях восстановления высокочастотной части звукового сигнала.

В конкретном аспекте способ включает в себя определение, в устройстве кодирования речи, первых параметров формы на основании гармонически расширенного сигнала и/или на основании остаточного сигнала верхнего диапазона, ассоциированного с высокочастотной частью звукового сигнала. В еще одном конкретном аспекте первые параметры формы коэффициента передачи определяют на основании временного изменения в остаточном сигнале верхнего диапазона, ассоциированном с высокочастотной частью звукового сигнала. Способ также включает в себя определение вторых параметров формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и на основании высокочастотной части звукового сигнала. Способ также включает в себя вставку первых параметров формы коэффициента передачи и вторых параметров формы коэффициента передачи в закодированную версию звукового сигнала в целях обеспечения возможности настройки коэффициента передачи во время воспроизведения звукового сигнала из закодированной версии звукового сигнала.

В еще одном конкретном аспекте устройство содержит первый блок оценки формы коэффициента передачи, сконфигурированный для определения первых параметров формы коэффициента передачи на основании гармонически расширенного сигнала и/или на основании остаточного сигнала верхнего диапазона, ассоциированного с высокочастотной частью звукового сигнала. Устройство также содержит второй блок оценки формы коэффициента передачи, сконфигурированный для определения вторых параметров формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и на основании высокочастотной части звукового сигнала. Устройство также содержит мультиплексор, сконфигурированный для вставки первых параметров формы коэффициента передачи и вторых параметров формы коэффициента передачи в закодированную версию звукового сигнала в целях обеспечения возможности настройки коэффициента передачи во время воспроизведения звукового сигнала из закодированной версии звукового сигнала.

В еще одном конкретном аспекте постоянный машиночитаемый носитель информации содержит инструкции, которые, при их исполнении процессором, вызывают выполнение процессором определения первых параметров формы коэффициента передачи на основании гармонически расширенного сигнала и/или на основании остаточного сигнала верхнего диапазона, ассоциированного с высокочастотной частью звукового сигнала. Инструкции также могут быть исполнены для вызывания выполнения процессором определения вторых параметров формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и на основании высокочастотной части звукового сигнала. Инструкции также могут быть исполнены для вызывания выполнения процессором вставки первых параметров формы коэффициента передачи и вторых параметров формы коэффициента передачи в закодированную версию звукового сигнала в целях обеспечения возможности настройки коэффициента передачи во время воспроизведения звукового сигнала из закодированной версии звукового сигнала.

В еще одном конкретном аспекте устройство содержит средство для определения первых параметров формы коэффициента передачи на основании гармонически расширенного сигнала и/или на основании остаточного сигнала верхнего диапазона, ассоциированного с высокочастотной частью звукового сигнала. Устройство также содержит средство для определения вторых параметров формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и на основании высокочастотной части звукового сигнала. Устройство также содержит средство для вставки первых параметров формы коэффициента передачи и вторых параметров формы коэффициента передачи в закодированную версию звукового сигнала в целях обеспечения возможности настройки коэффициента передачи во время воспроизведения звукового сигнала из закодированной версии звукового сигнала.

В еще одном конкретном аспекте способ включает в себя прием, в устройстве декодирования речи, закодированного звукового сигнала от устройства кодирования речи. Закодированный звуковой сигнал включает в себя первые параметры формы коэффициента передачи, основанные на первом гармонически расширенном сигнале, сгенерированном в устройстве кодирования речи, и/или основанные на остаточном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи. Закодированный звуковой сигнал также включает в себя вторые параметры формы коэффициента передачи, основанные на первом синтезированном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи, и основанные на верхнем диапазоне звукового сигнала. Способ также включает в себя воспроизведение звукового сигнала из кодируемого звукового сигнала на основании первых параметров формы коэффициента передачи и на основании вторых параметров формы коэффициента передачи.

В еще одном конкретном аспекте устройство декодирования речи сконфигурировано для приема закодированного звукового сигнала от устройства кодирования речи. Закодированный звуковой сигнал включает в себя первые параметры формы коэффициента передачи, основанные на гармонически расширенном сигнале, сгенерированном в устройстве кодирования речи, и/или основанные на остаточном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи. Закодированный звуковой сигнал также включает в себя вторые параметры формы коэффициента передачи, основанные на первом синтезированном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи, и основанные на верхнем диапазоне звукового сигнала. Устройство декодирования речи также сконфигурировано для воспроизведения звукового сигнала из закодированного звукового сигнала на основании первых параметров формы коэффициента передачи и на основании вторых параметров формы коэффициента передачи.

В еще одном конкретном аспекте устройство содержит средство для приема закодированного звукового сигнала от устройства кодирования речи. Закодированный звуковой сигнал включает в себя первые параметры формы коэффициента передачи, основанные на первом гармонически расширенном сигнале, сгенерированном в устройстве кодирования речи, и/или основанные на остаточном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи. Закодированный звуковой сигнал также включает в себя вторые параметры формы коэффициента передачи, основанные на первом синтезированном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи, и основанные на верхнем диапазоне звукового сигнала. Устройство также содержит средство для воспроизведения звукового сигнала из кодируемого звукового сигнала на основании первых параметров формы коэффициента передачи и на основании вторых параметров формы коэффициента передачи.

В еще одном конкретном аспекте постоянный машиночитаемый носитель информации содержит инструкции, которые, при их исполнении процессором, вызывают выполнение процессором приема закодированного звукового сигнала от устройства кодирования речи. Закодированный звуковой сигнал включает в себя первые параметры формы коэффициента передачи, основанные на первом гармонически расширенном сигнале, сгенерированном в устройстве кодирования речи, и/или основанные на остаточном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи. Закодированный звуковой сигнал также включает в себя вторые параметры формы коэффициента передачи, основанные на первом синтезированном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи, и основанные на верхнем диапазоне звукового сигнала. Инструкции также могут быть исполнены для вызывания выполнения процессором воспроизведения звукового сигнала из кодируемого звукового сигнала на основании первых параметров формы коэффициента передачи и на основании вторых параметров формы коэффициента передачи.

Конкретные преимущества, предоставляемые по меньшей мере одним из раскрытых вариантов осуществления, включают в себя улучшение энергетической корреляции между гармонически расширенным возбуждением нижнего диапазона звукового сигнала и остатком верхнего диапазона звукового сигнала. Например, гармонически расширенное возбуждение нижнего диапазона может быть скорректировано на основании параметров формы коэффициента передачи в целях более точного соответствия временным характеристикам остаточного сигнала верхнего диапазона. Другие аспекты, преимущества и характеристики настоящего раскрытия станут очевидными после анализа всей заявки, включая следующие разделы: краткое описание чертежей, подробное описание и формула изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг. 1 представляет собой диаграмму для иллюстрации конкретного варианта осуществления системы, который пригоден для определения параметров формы коэффициента передачи на двух этапах в целях восстановления верхнего диапазона;

Фиг. 2 представляет собой диаграмму для иллюстрации конкретного варианта осуществления системы, который пригоден для определения параметров формы коэффициента передачи на первом этапе на основании гармонически расширенного сигнала и/или остаточного сигнала верхнего диапазона;

Фиг. 3 представляет собой временную диаграмму для иллюстрации параметров формы коэффициента передачи на основании различий между гармонически расширенным сигналом и остаточным сигналом верхнего диапазона;

Фиг. 4 представляет собой диаграмму для иллюстрации конкретного варианта осуществления системы, который пригоден для определения вторых параметров формы коэффициента передачи на втором этапе на основании синтезированного сигнала верхнего диапазона и высокочастотной части входного звукового сигнала;

Фиг. 5 представляет собой диаграмму для иллюстрации конкретного варианта осуществления системы, который пригоден для воспроизведения звукового сигнала с использованием параметров формы коэффициента передачи;

Фиг. 6 представляет собой блок-схему для иллюстрации конкретных вариантов осуществления способов для использования оценок коэффициента передачи для восстановления верхнего диапазона; и

Фиг. 7 представляет собой блок-схему беспроводного устройства, пригодного для выполнения операций обработки сигналов в соответствии с системами и способами с фиг. 1-6.

ПОДРОБНОЕ ОПИСАНИЕ

Обратимся к фиг. 1; показан и в общих чертах определен конкретный вариант осуществления системы 100, который способен определять параметры формы коэффициента передачи на двух этапах в целях восстановления верхнего диапазона. В конкретном варианте осуществления система 100 может быть интегрирована в систему или устройство кодирования (например, в беспроводной телефон, кодирующее устройство/декодирующее устройство (CODEC) или цифровой сигнальный процессор (DSP)). В других конкретных вариантах осуществления система 100 может быть интегрирована в телевизионную приставку, музыкальный проигрыватель, видеоплеер, развлекательный модуль, навигационный прибор, коммуникационное устройство, КПК, блок данных фиксированного местоположения или компьютер.

Следует отметить, что в приведенном ниже описании различные функции, выполняемые системой 100 с фиг. 1 описаны как выполняемые определенными узлами или модулями. Однако, такое деление узлов и модулей приведено только в целях иллюстрации. В альтернативном варианте осуществления функция, выполняемая конкретным узлом или модулем, может вместо этого быть разделена между множеством узлов или модулей. Кроме того, в альтернативном варианте осуществления, два или более узлов или модулей с фиг. 1 могут быть интегрированы в единственный узел или модуль. Каждый узел или модуль, проиллюстрированный на фиг. 1, может быть реализован с применением аппаратного обеспечения (например, устройства на программируемой в условиях эксплуатации матрице логических элементов (FPGA), специализированная интегральная схема (ASIC), DSP, контроллер, и т.д.), программного обеспечения (например, инструкций, исполнимых процессором), или произвольной комбинации указанного.

Система 100 содержит набор 110 фильтров для частотного разложения сигнала, который сконфигурирован для приема входного звукового сигнала 102. Например, входной звуковой сигнал 102 может быть получен посредством микрофона или другого устройства ввода. В конкретном варианте осуществления входной звуковой сигнал 102 может содержать речь. Входной звуковой сигнал 102 может представлять собой сигнал SWB, который содержит данные в частотном диапазоне от приблизительно 50 Гц до приблизительно 16 кГц. Набор 110 фильтров для частотного разложения сигнала может фильтровать входной звуковой сигнал 102 на множество частей на основании частоты. Например, набор 110 фильтров для частотного разложения сигнала может генерировать сигнал 122 нижнего диапазона и сигнал 124 верхнего диапазона. Сигнал 122 нижнего диапазона и сигнал 124 верхнего диапазона могут иметь равную или неравную полосу частот, и могут перекрываться или не перекрываться друг с другом. В альтернативном варианте осуществления набор 110 фильтров для частотного разложения сигнала может генерировать более двух выходных сигналов.

В примере на фиг. 1 сигнал 122 нижнего диапазона и сигнал 124 верхнего диапазона занимают неперекрывающиеся полосы частот. Например, сигнал 122 нижнего диапазона и сигнал 124 верхнего диапазона могут занимать неперекрывающиеся полосы частот 50 Гц-7 кГц и 7 кГц–16 кГц, соответственно. В альтернативном варианте осуществления сигнал 122 нижнего диапазона и сигнал 124 верхнего диапазона могут занимать неперекрывающиеся полосы частот 50 Гц-8 кГц и 8 кГц-16 кГц, соответственно. В другом альтернативном варианте осуществления сигнал 122 нижнего диапазона и сигнал 124 верхнего диапазона перекрываются (например, 50 Гц-8 кГц и 7 кГц–16 кГц, соответственно), что может обеспечить для фильтра нижних частот и фильтра высоких частот набора 110 фильтров для частотного разложения сигнала возможность иметь гладкий спад, что может упростить конструкцию и снизить стоимость фильтра нижних частот и фильтра высоких частот. Перекрытие сигнала 122 нижнего диапазона 122 и сигнала 124 верхнего диапазона может также обеспечивать возможность плавного смешивания сигналов нижнего диапазона и сигнала верхнего диапазона в приемнике, что может уменьшить количество звуковых артефактов.

Следует отметить, что хотя пример с фиг. 1 иллюстрирует обработку сигнала SWB, это является только иллюстрацией. В альтернативном варианте осуществления входной звуковой сигнал 102 может быть сигналом WB, имеющим частотный диапазон от приблизительно 50 Гц до приблизительно 8 кГц. В таком варианте осуществления сигнал 122 нижнего диапазона, может, например, соответствовать частотному диапазону от приблизительно 50 Гц до приблизительно 6,4 кГц, и сигнал 124 верхнего диапазона может соответствовать частотному диапазону от приблизительно 6,4 кГц до приблизительно 8 кГц.

Система 100 может содержать модуль 130 анализа нижнего диапазона, сконфигурированный для приема сигнала 122 нижнего диапазона. В конкретном варианте осуществления модуль 130 анализа нижнего диапазона может представлять собой вариант осуществления устройства кодирования на основе линейного предсказания с кодовым возбуждением (CELP). Модуль 130 анализа нижнего диапазона может содержать модуль анализа и кодирования линейного предсказания (LP) 132, модуль 134 преобразования коэффициентов линейного предсказания (LPC) в LSP и импульсный модулятор 136. LSP могут также называться LSF, и два термина (LSP и LSF) могут быть использованы взаимозаменяемо в настоящем описании. Модуль 132 анализа и кодирования LP может кодировать огибающую спектра сигнала 122 нижнего диапазона как множество LPC. LPC могут генерироваться для каждого кадра аудио (например, 20 миллисекунд (мс) аудио, что соответствует 320 дискретным значениям при частоте дискретизации 16 кГц), каждого подкадра аудио (например, 5 мс аудио), или произвольной комбинации указанного. Число LPC, генерируемых для каждого кадра или подкадра, может быть определено "порядком" выполняемого анализа LP. В конкретном варианте осуществления модуль 132 анализа и кодирования LP может генерировать множество из одиннадцати LPC, соответствующих анализу LP десятого порядка.

Модуль 134 преобразования LPC в LSP может преобразовывать множество LPC, сгенерированных посредством модуля 132 анализа и кодирования LP 132, в соответствующее множество LSP (например, с применением взаимно однозначного преобразования). Альтернативно, множество LPC может быть взаимно однозначно преобразовано в соответствующее множество коэффициентов частичной автокорреляции, значений отношения логарифмов площадей, спектральные пары иммитансов (ISP), или спектральные частоты иммитансов (ISF). Преобразование между набором LPC и набором LSP может являться безошибочно обратимым.

Импульсный модулятор 136 может квантовать набор LSP, сгенерированных модулем 134 преобразования. Например, импульсный модулятор 136 может содержать или может быть соединен с множеством кодовых книг, которые содержат множество записей (например, векторов). Для того, чтобы квантовать множество LSP, импульсный модулятор 136 может идентифицировать записи кодовых книг, которые являются «наиболее близкими» (например, на основании меры искажения, такой как наименьшие квадраты или среднеквадратичная ошибка) к множеству LSP. Импульсный модулятор 136 может выдавать значение индекса или ряд значений индексов, соответствующих положению идентифицированных записей в кодовой книге. Выход импульсного модулятора 136 может, таким образом, представлять собой параметры фильтра нижнего диапазона, которые включены в поток 142 битов нижнего диапазона.

Модуль 130 анализа нижнего диапазона может также генерировать сигнал 144 возбуждения нижнего диапазона. Например, сигнал 144 возбуждения нижнего диапазона может представлять собой закодированный сигнал, который генерируется посредством квантования остаточного сигнала LP, который генерируется во время процесса LP, выполняемого модулем 130 анализа нижнего диапазона. Остаточный сигнал LP может представлять ошибку предсказания.

Система 100 может также содержать модуль 150 анализа верхнего диапазона, сконфигурированный для приема сигнала 124 верхнего диапазона от набора 110 фильтров для частотного разложения сигнала и сигнала 144 возбуждения нижнего диапазона от модуля 130 анализа нижнего диапазона. Модуль 150 анализа верхнего диапазона может генерировать дополнительную информацию верхнего диапазона 172 на основании сигнала 124 верхнего диапазона и сигнала 144 возбуждения нижнего диапазона. Например, дополнительная информация 172 верхнего диапазона может включать в себя LSP верхнего диапазона и/или информацию о коэффициенте передачи (например, на основании, по меньшей мере, отношения энергии верхнего диапазона к энергии нижнего диапазона) в соответствии с подробнее описанным в настоящем описании. В конкретном варианте осуществления информация о коэффициенте передачи может включать в себя параметры формы коэффициента передачи, основанные на гармонически расширенном сигнале и/или остаточном сигнале верхнего диапазона. Гармонически расширенный сигнал может быть не подходящим для применения в синтезе верхнего диапазона вследствие недостаточной корреляции между сигналом 124 верхнего диапазона и сигналом 122 нижнего диапазона. Например, подкадры сигнала 124 верхнего диапазона могут содержать флуктуации в энергетических уровнях, которые не имитируются должным образом в смоделированном сигнале 161 возбуждения верхнего диапазона.

Модуль 150 анализа верхнего диапазона может содержать первый блок 190 оценки формы коэффициента передачи. Первый блок 190 оценки формы коэффициента передачи может определять первые параметры формы коэффициента передачи на основании первого сигнала, ассоциированного с сигналом 122 нижнего диапазона, и/или на основании высокочастотного остатка сигнала 124 верхнего диапазона. Как описано в настоящем описании, первый сигнал может представлять собой преобразованное (например, нелинейно или гармонически расширенное) возбуждение нижнего диапазона сигнала 122 нижнего диапазона. Дополнительная информация 172 верхнего диапазона может включать в себя первые параметры формы коэффициента передачи. Модуль 150 анализа верхнего диапазона может также содержать первый блок 192 настройки формы коэффициента передачи, сконфигурированный для настройки гармонически расширенного возбуждения нижнего диапазона на основании первых параметров формы коэффициента передачи. Например, первый блок 192 настройки формы коэффициента передачи может масштабировать конкретные подкадры гармонически расширенного возбуждения нижнего диапазона в целях аппроксимации энергетических уровней соответствующих подкадров остатка сигнала 124 верхнего диапазона.

Модуль 150 анализа верхнего диапазона может также содержать генератор 160 возбуждения верхнего диапазона. Генератор 160 возбуждения верхнего диапазона может генерировать сигнал 161 возбуждения верхнего диапазона посредством расширения спектра сигнала 144 возбуждения нижнего диапазона в частотный диапазон верхнего диапазона (например, 7 кГц-16 кГц). В качестве иллюстрации, генератор 160 возбуждения верхнего диапазона может смешивать скорректированное гармонически расширенное возбуждение нижнего диапазона с шумовым сигналом (например, белым шумом, модулированным в соответствии с огибающей, соответствующей сигналу 144 возбуждению нижнего диапазона, которое имитирует медленно изменяющиеся временные характеристики сигнала 122 нижнего диапазона) для генерации сигнала 161 возбуждения верхнего диапазона. Например, смешивание может быть выполнено согласно следующему уравнению:

Возбуждение верхнего диапазона=(α*скорректированное гармонически расширенное возбуждение нижнего диапазона)+((1-α)*модулированный шум)

Отношение, в котором смешаны скорректированное гармонически расширенное возбуждение нижнего диапазона и модулированный шум, может повлиять на качество восстановления верхнего диапазона в приемнике. Для речевых голосовых сигналов смешивание может отклоняться в направлении скорректированного гармонически расширенного возбуждения нижнего диапазона (например, коэффициент смешивания α может находиться в диапазоне от 0,5 до 1,0). Для неголосовых сигналов смешивание может отклоняться в направлении модулированного шума (например, коэффициент смешивания α может находиться в диапазоне от 0,0 до 0,5).

Как проиллюстрировано, модуль 150 анализа верхнего диапазона может также содержать модуль 152 анализа и кодирования LP, модуль 154 преобразования LPC в LSP и импульсный модулятор 156. Каждый модуль 152 анализа и кодирования LP, модуль преобразования 154, и импульсный модулятор 156 может функционировать в соответствии с описанным выше в отношении соответствующих узлов модуля 130 анализа нижнего диапазона, но в сравнительно пониженном разрешении (например, с использованием меньшего числа битов для каждого коэффициента, LSP и т.д.). Модуль 152 анализа и кодирования LP может генерировать множество LPC, которые преобразуются в LSP модулем 154 преобразования и квантуются импульсным модулятором 156 на основании кодовой книги 163. Например, модуль 152 анализа и кодирования LP, модуль преобразования 154 и импульсный модулятор 156 могут использовать сигнал 124 верхнего диапазона, который включен в дополнительную информацию 172 верхнего диапазона, для определения информации фильтра верхнего диапазона (например, LSP верхнего диапазона).

Импульсный модулятор 156 может быть сконфигурирован для квантования множества значений спектральных частот, таких как LSP, предоставленных модулем 154 преобразования. В других вариантах осуществления импульсный модулятор 156 может принимать и квантовать множества одного или более других типов значений спектральных частот в дополнение, или вместо, LSF или LSP. Например, импульсный модулятор 156 может принимать и квантовать множество LPC, сгенерированных модулем 152 анализа и кодирования LP. Другие примеры включают множества коэффициентов частичной автокорреляции, значений отношений логарифмов площадей и ISF, которые могут быть приняты и проквантованы в импульсном модуляторе 156. Импульсный модулятор 156 может содержать векторный импульсный модулятор, который кодирует входной вектор (например, множество значений спектральной частоты в векторном формате) в качестве индекса соответствующей записи в таблице или кодовой книге, такой как кодовая книга 163. В качестве другого примера, импульсный модулятор 156 может быть сконфигурирован для определения одного или более параметров, по которым входной вектор может генерироваться динамически в декодирующем устройстве, например, в варианте осуществления разреженной кодовой книги, а не извлекаться из хранилища. В качестве иллюстрации, примеры разреженной кодовой книги могут быть применены в таких схемах кодирования, как CELP и кодеках, соответствующих промышленным стандартам, таким как 3GPP2 (партнерство третьего поколения 2) EVRC (улучшенный кодек с переменной скоростью). В другом варианте осуществления модуль 150 анализа верхнего диапазона может содержать импульсный модулятор 156 и может быть сконфигурирован для использования ряда векторов кодовой книги для генерации синтезированных сигналов (например, согласно множеству параметров фильтрации) и выбора одного из векторов кодовой книги, ассоциированных с синтезированным сигналом, который наилучшим образом соответствует сигналу 124 верхнего диапазона, например, в области, взвешенной восприятием.

В конкретном варианте осуществления дополнительная информация 172 верхнего диапазона может включать в себя LSP верхнего диапазона, а также параметры коэффициента передачи верхнего диапазона. Например, сигнал 161 возбуждения верхнего диапазона может использоваться для определения дополнительных параметров формы коэффициента передачи, которые включены в дополнительную информацию 172 верхнего диапазона. Модуль 150 анализа верхнего диапазона может содержать второй блок 194 оценки формы коэффициента передачи и второй блок 196 настройки формы коэффициента передачи. Операция синтеза коэффициентов линейного предсказания может быть выполнена на сигнале 161 возбуждения верхнего диапазона для генерации синтезированного сигнала верхнего диапазона. Второй блок 194 оценки формы коэффициента передачи может определять вторые параметры формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и сигнала 124 верхнего диапазона. Дополнительная информация 172 верхнего диапазона может включать в себя вторые параметры формы коэффициента передачи. Второй блок 196 настройки формы коэффициента передачи может быть сконфигурирован для настройки синтезированного сигнала верхнего диапазона на вторые параметры формы коэффициента передачи. Например, второй блок 196 настройки формы коэффициента передачи может масштабировать конкретные подкадры синтезированного сигнала верхнего диапазона для аппроксимации энергетических уровней соответствующих подкадров сигнала 124 верхнего диапазона.

Поток 142 битов нижнего диапазона и дополнительная информация 172 верхнего диапазона могут быть мультиплексированы мультиплексором (MUX) 180 для генерации выходного потока 199 битов. Выходной поток 199 битов может представлять закодированный звуковой сигнал, соответствующий входному звуковому сигналу 102. Например, выходной поток 199 битов может быть передан (например, по проводному, беспроводному или оптическому каналу) и/или сохранен. Таким образом, мультиплексор 180 может вставлять первые параметры формы коэффициента передачи, определенные первым блоком 190 оценки формы коэффициента передачи, и вторые параметры формы коэффициента передачи, определенные вторым блоком 194 оценки формы коэффициента передачи, в выходной поток 199 битов для обеспечения возможности настройки коэффициента передачи возбуждения верхнего диапазона во время воспроизведения входного звукового сигнала 102. В приемнике обратные операции могут быть выполнены демультиплексором (DEMUX), декодирующим устройством нижнего диапазона, декодирующим устройством верхнего диапазона и множеством фильтров для генерации звукового сигнала (например, восстановленной версии входного звукового сигнала 102, который выдается на динамик или другое устройство вывода). Число битов, используемое для представления потока 142 битов нижнего диапазона, может быть существенно больше, чем число битов, используемое для представления дополнительной информации 172 верхнего диапазона. Таким образом, большинство битов в выходном потоке 199 битов может представлять данные нижнего диапазона. Дополнительная информация 172 верхнего диапазона может использоваться в приемнике для восстановления сигнала возбуждения верхнего диапазона по данным нижнего диапазона в соответствии с моделью сигнала. Например, модель сигнала может представлять ожидаемое множество зависимостей или корреляций между данными нижнего диапазона (например, сигналом 122 нижнего диапазона) и данными верхнего диапазона (например, сигналом 124 верхнего диапазона). Таким образом, различные модели сигналов могут использоваться для различных типов аудиоданных (например, речь, музыка, и т.д.), и конкретная используемая модель сигнала может быть согласована передатчиком и приемником (или определена промышленным стандартом) до начала передачи закодированных аудиоданных. С использованием модели сигнала модуль 150 анализа верхнего диапазона в передатчике имеет возможность генерации дополнительной информации 172 верхнего диапазона таким образом, чтобы соответствующий модуль анализа верхнего диапазона в приемнике был в состоянии использовать модель сигнала для восстановления сигнала 124 верхнего диапазона из выходного потока 199 битов.

Система 100 может улучшить покадровую энергетическую корреляцию (например, улучшить изменение с течением времени) между гармонически расширенным возбуждением нижнего диапазона звукового сигнала 102 и высокочастотным остатком входного звукового сигнала 102. Например, во время первого этапа оценки коэффициента передачи, первый блок 190 оценки формы коэффициента передачи и первый блок 192 настройки формы коэффициента передачи могут скорректировать гармонически расширенное возбуждение нижнего диапазона на основании первых параметров формы коэффициента передачи. Гармонически расширенное возбуждение нижнего диапазона может быть скорректировано для получения аппроксимации остатка верхнего диапазона на покадровом базисе. Корректировка гармонически расширенного возбуждения нижнего диапазона может улучшить оценку формы коэффициента передачи в области синтеза и сократить звуковые артефакты во время восстановления верхнего диапазона входного звукового сигнала 102. Система 100 может также улучшить покадровую энергетическую корреляцию между сигналом 124 верхнего диапазона и синтезированной версией сигнала 124 верхнего диапазона. Например, во время второго этапа оценки коэффициента передачи, второй блок 194 оценки формы коэффициента передачи и второй блок 196 настройки формы коэффициента передачи могут корректировать синтезированную версию сигнала 124 верхнего диапазона на основании вторых параметров формы коэффициента передачи. Синтезированная версия сигнала 124 верхнего диапазона может быть скорректирована для аппроксимации сигнала 124 верхнего диапазона на покадровом базисе. Первые и вторые параметры формы коэффициента передачи могут быть переданы декодирующему устройству для сокращения звуковых артефактов во время восстановления верхнего диапазона входного звукового сигнала 102.

Обратимся к фиг. 2, на которой показан конкретный вариант осуществления системы 200, которая способна определять параметры формы коэффициента передачи на первом этапе на основании гармонически расширенного сигнала и/или остаточного сигнала верхнего диапазона. Система 200 содержит фильтр 204 анализа линейного предсказания, генератор 207 нелинейного возбуждения, модуль 214 идентификации кадра, первый блок 190 оценки формы коэффициента передачи и первый блок 192 настройки формы коэффициента передачи.

Сигнал 124 верхнего диапазона может быть подан на фильтр 204 анализа линейного предсказания. Фильтр 204 анализа линейного предсказания может быть сконфигурирован для генерации остаточного сигнала 224 верхнего диапазона на основании сигнала 124 верхнего диапазона (например, высокочастотной части входного звукового сигнала 102). Например, фильтр 204 анализа линейного предсказания может кодировать огибающую спектра сигнала 124 верхнего диапазона как множество LPC, используемых для предсказания будущих дискретных значений (на основании текущих дискретных значений) сигнала 124 верхнего диапазона. Остаточный сигнал 224 верхнего диапазона может быть передан модулю идентификации 214 кадра и первому блоку 190 оценки формы коэффициента передачи.

Модуль 214 идентификации кадра может быть сконфигурирован для определения режима кодирования для конкретного кадра остаточного сигнала 224 верхнего диапазона и генерации сигнала 216 указания режима кодирования на основании режима кодирования. Например, модуль 214 идентификации кадра может определять, является ли конкретный кадр остаточного сигнала 224 верхнего диапазона голосовым кадром или неголосовым кадром. В конкретном варианте осуществления голосовой кадр может соответствовать первому режиму кодирования (например, первой метрике), и неголосовой кадр может соответствовать второму режиму кодирования (например, второй метрике).

Сигнал 144 возбуждения нижнего диапазона может быть подан на нелинейный генератор 207 возбуждения. Как описано в отношении фиг. 1, сигнал 144 возбуждения нижнего диапазона может генерироваться по сигналу 122 нижнего диапазона (например, части нижнего диапазона входного звукового сигнала 102) с применением модуля 130 анализа нижнего диапазона. Генератор 207 нелинейного возбуждения может быть сконфигурирован для генерации гармонически расширенного сигнала 208 на основании сигнала 144 возбуждения нижнего диапазона. Например, генератор 207 нелинейного возбуждения может выполнять операцию взятия абсолютной величины или возведения в квадрат на кадрах (или подкадрах) сигнала 144 возбуждения нижнего диапазона для генерации гармонически расширенного сигнала 208.

В качестве иллюстрации, генератор 207 нелинейного возбуждения может увеличивать частоту дискретизации сигнала 144 возбуждения нижнего диапазона (например, сигнала в пределах приблизительно от 0 кГц до 8 кГц) для генерации сигнала на 16 кГц в пределах приблизительно от 0 кГц до 16 кГц (например, сигнал, имеющий ширину полосы, приблизительно в два раза превышающую ширину полосы сигнала 144 возбуждения нижнего диапазона), и впоследствии выполнять нелинейную операцию на сигнале с увеличенной частотой дискретизации. Низкочастотная часть сигнала 16 кГц (например, приблизительно от 0 кГц до 8 кГц) может иметь по существу такие же гармоники, как сигнал 144 возбуждения нижнего диапазона, и высокочастотная часть сигнала 16 кГц (например, приблизительно от 8 кГц до 16 кГц) может быть по существу свободной от гармоник. Генератор 207 нелинейного возбуждения может расширить "доминирующие" гармоники в низкочастотной части сигнала 16 кГц в высокочастотную часть сигнала 16 кГц для генерации гармонически расширенного сигнала 208. Таким образом, гармонически расширенный сигнал 208 может представлять собой гармонически расширенную версию сигнала 144 возбуждения нижнего диапазона, в котором гармоники расширены в высокочастотную область с применением нелинейных операций (например, операций возведения в квадрат и/или операций взятия абсолютной величины). Гармонически расширенный сигнал 208 может быть подан в первый блок 190 оценки формы коэффициента передачи и в первый блок 192 настройки формы коэффициента передачи.

Первый блок 190 оценки формы коэффициента передачи может принимать сигнал 216 указания режима кодирования и определять частоту дискретизации на основании режима кодирования. Например, первый блок 190 оценки формы коэффициента передачи может дискретизировать первый кадр гармонически расширенного сигнала 208 для генерации первого множества подкадров и может дискретизировать второй кадр остаточного сигнала 224 верхнего диапазона в аналогичные моменты времени для генерации второго множества подкадров. Число подкадров (например, размеры вектора) в первом и втором множестве подкадров может быть основано на режиме кодирования. Например, первое (и второе) множество подкадров может содержать первое число подкадров в случае, если определено, что режим кодирования указывает, что конкретный кадр остаточного сигнала 224 верхнего диапазона является голосовым кадром. В конкретном варианте осуществления как первое, так и второе множество подкадров может содержать шестнадцать подкадров в случае, если определено, что конкретный кадр остаточного сигнала 224 верхнего диапазона не является голосовым кадром. Альтернативно, первое (и второе) множество подкадров может содержать второе число подкадров, которое меньше, чем первое число подкадров, в случае, если было определено, что режим кодирования указывает, что конкретный кадр остаточного сигнала 224 верхнего диапазона, является неголосовым кадром. Например, как первое, так и второе множество подкадров может содержать восемь подкадров в случае, если было определено, что режим кодирования указывает, что конкретный кадр остаточного сигнала 224 верхнего диапазона не является голосовым кадром.

Первый блок 190 оценки формы коэффициента передачи может быть сконфигурирован для определения первых параметров 242 формы коэффициента передачи на основании гармонически расширенного сигнала 208 и/или остаточного сигнала 224 верхнего диапазона. Первый блок 190 оценки формы коэффициента передачи может оценивать энергетические уровни каждого подкадра первого множества подкадров и оценивать энергетические уровни каждого соответствующего подкадра второго множества подкадров. Например, первые параметры 242 формы коэффициента передачи могут идентифицировать конкретные подкадры гармонически расширенного сигнала 208, которые имеют более низкие или более высокие энергетические уровни, чем соответствующие подкадры остаточного сигнала 224 верхнего диапазона. Первый блок 190 оценки формы коэффициента передачи может также определять величину масштабирования энергии, предоставляемой для каждого конкретного подкадра расширенного сигнала 208, на основании режима кодирования. Масштабирование энергии может быть выполнено на уровне подкадров гармонически расширенного сигнала 208, имеющего более низкий или более высокий энергетический уровень по сравнению с соответствующими подкадрами остаточного сигнала 224 верхнего диапазона. Например, в случае, если было определено, что режим кодирования имеет первую метрику (например, голосовой кадр), то конкретный подкадр гармонически расширенного сигнала 208 может быть масштабирован коэффициентом (αRHB2)/(αR’LB2), где (αR’LB2) соответствует энергетическому уровню конкретного подкадра гармонически расширенного сигнала 208, и (αRHB2) соответствует энергетическому уровню соответствующего подкадра остаточного сигнала 224 верхнего диапазона. Альтернативно, в случае, если было определено, что режим кодирования имеет вторую метрику (например, неголосовой кадр), то конкретный подкадр гармонически расширенного сигнала 208 может быть масштабирован коэффициентом α(RHB)*(R’LB)]/(αR’LB2). Первые параметры 242 формы коэффициента передачи могут идентифицировать каждый подкадр гармонически расширенного сигнала 208, для которого требуется масштабирование энергии, и может идентифицировать вычисленный коэффициент масштабирования энергии для соответствующих подкадров. Первые параметры 242 формы коэффициента передачи могут быть переданы первому блоку 192 настройки формы коэффициента передачи и мультиплексору 180 с фиг. 1 в виде дополнительной информации 172 верхнего диапазона.

Первый блок 192 настройки формы коэффициента передачи может быть сконфигурирован для корректирования гармонически расширенного сигнала 208 на основании первых параметров 242 формы коэффициента передачи для генерации скорректированного гармонически расширенного сигнала 244. Например, первый блок 192 настройки формы коэффициента передачи может определять масштаб идентифицированных подкадров гармонически расширенного сигнала 208 согласно вычисленному масштабированию энергии для генерации скорректированного гармонически расширенного сигнала 244. Скорректированный гармонически расширенный сигнал 244 может быть предоставлен блоку 202 отслеживания огибающей и первому блоку 254 объединения для выполнения операции масштабирования.

Блок 202 отслеживания огибающей может быть сконфигурирован для приема скорректированного гармонически расширенного сигнала 244 и вычисления огибающей 203 временной области нижнего диапазона, соответствующей скорректированному гармонически расширенному сигналу 244. Например, блок 202 отслеживания огибающей может быть сконфигурирован для вычисления квадрата каждого дискретного значения кадра скорректированного гармонически расширенного сигнала 244 с получением последовательности квадратов значений. Блок 202 отслеживания огибающей может быть сконфигурирован для выполнения операции сглаживания на последовательности квадратов значений, например, посредством применения фильтра нижних частот с бесконечной импульсной характеристикой первого порядка (IIR) к последовательности квадратов значений. Блок 202 отслеживания огибающей может быть сконфигурирован для применения функции корня квадратного к каждому дискретному значению сглаженной последовательности для получения огибающей временной области нижнего диапазона 203. Блок 202 отслеживания огибающей может также применять операцию взятия абсолютного значения вместо операции возведения в квадрат. Огибающая временной области нижнего диапазона 203 может быть предоставлена блоку 240 объединения шума.

Блок 240 объединения шума может быть сконфигурирован для комбинирования огибающей 203 временной области нижнего диапазона с белым шумом 205, сгенерированным генератором белого шума (не показан) для получения модулированного шумового сигнала 220. Например, блок 240 объединения шума может быть сконфигурирован для амплитудного модулирования белого шума 205 в соответствии с огибающей 203 временной области нижнего диапазона. В конкретном варианте осуществления блок 240 объединения шума может быть реализован как умножитель, который сконфигурирован для масштабирования белого шума 205 в соответствии с огибающей временной области нижнего диапазона 203 для выдачи модулированного шумового сигнала 220. Модулированный шумовой сигнал 220 может быть предоставлен второму блоку 256 объединения.

Первый блок объединения 254 может быть реализован как умножитель, который сконфигурирован для масштабирования скорректированного гармонически расширенного сигнала 244 в соответствии с коэффициентом смешивания (α) для генерации первого масштабированного сигнала. Второй блок 256 объединения может быть реализован как умножитель, который сконфигурирован для масштабирования модулированного шумового сигнала 220 на основании коэффициента смешивания (1-α) для генерации второго масштабированного сигнала. Например, второй блок 256 объединения может масштабировать модулированный шумовой сигнал 220 на основании разности единицы и коэффициента смешивания (например, 1-α). Первый масштабированный сигнал и второй масштабированный сигнал могут быть переданы блоку 211 смешивания.

Блок 211 смешивания может генерировать сигнал 161 возбуждения верхнего диапазона на основании коэффициента смешивания (α) скорректированного гармонически расширенного сигнала 244 и модулированного шумового сигнала 220. Например, блок 211 смешивания может комбинировать первый масштабированный сигнал и второй масштабированный сигнал для генерации сигнала 161 возбуждения верхнего диапазона.

Система 200 с фиг. 2 может улучшить временное изменение энергии между гармонически расширенным сигналом 208 и остаточным сигналом 224 верхнего диапазона. Например, первый блок 190 оценки формы коэффициента передачи и первый блок 192 настройки формы коэффициента передачи могут скорректировать гармонически расширенный сигнал 208 на основании первых параметров 242 формы коэффициента передачи. Гармонически расширенный сигнал 208 может быть скорректирован для аппроксимации энергетических уровней остаточного сигнала 224 верхнего диапазона на базисе подкадров. Корректировка гармонически расширенного сигнала 208 может сократить звуковые артефакты в области синтеза, как описано в отношении фиг. 4. Система 200 может также динамически настраивать число подкадров на основании режима кодирования для изменения параметров 242 формы коэффициента передачи на основании флуктуаций высоты звука. Например, относительно небольшое число параметров 242 коэффициента передачи (например, относительно небольшое число подкадров) может быть сгенерировано для неголосового кадра, имеющего относительно низкую флуктуацию с течением времени в пределах кадра. Альтернативно, относительно большое число параметров 242 формы коэффициента передачи может генерироваться для голосового кадра, имеющего относительно высокое расхождение во временном изменении в пределах кадра. В альтернативном варианте осуществления число подкадров, выбранных для корректировки временного изменения гармонически расширенного нижнего диапазона может быть одинаковым как для неголосового кадра, так и для голосового кадра.

Обратимся к фиг. 3, на которой показана временная диаграмма 300 для иллюстрации параметров формы коэффициента передачи, основанных на энергетических расхождениях между гармонически расширенным сигналом и остаточным сигналом верхнего диапазона. Временная диаграмма 300 содержит первую кривую остаточного сигнала 224 верхнего диапазона, вторую кривую гармонически расширенного сигнала 208 и третью кривую оцененных параметров 242 формы коэффициента передачи.

Временная диаграмма 300 изображает конкретный кадр остаточного сигнала 224 верхнего диапазона и соответствующий кадр гармонически расширенного сигнала 208. Временная диаграмма 300 содержит первое окно 302 синхронизации, второе окно 304 синхронизации, третье окно 306 синхронизации, четвертое окно 308 синхронизации, пятое окно 310 синхронизации, шестое окно 312 синхронизации и седьмое окно 314 синхронизации. Каждое окно 302-314 синхронизации может представлять подкадр соответствующих сигналов 224, 208. Хотя изображено семь окон синхронизации, в других вариантах осуществления может присутствовать больше (или меньше) окон синхронизации. Например, в конкретном варианте осуществления, каждый соответствующий сигнал 224, 208 может содержать четыре окна синхронизации или шестнадцать окон синхронизации (то есть, четыре подкадра или шестнадцать подкадров). Число окон синхронизации может быть основано на режиме кодирования, как описано в отношении фиг. 2.

Энергетический уровень остаточного сигнала 224 верхнего диапазона в первом окне 302 синхронизации может аппроксимировать энергетический уровень соответствующего гармонически расширенного сигнала 208 в первом окне 302 синхронизации. Например, первый блок 190 оценки формы коэффициента передачи может измерять энергетический уровень остаточного сигнала 224 верхнего диапазона в первом окне 302 синхронизации, измерять энергетический уровень гармонически расширенного сигнала 208 в первом окне 302 синхронизации и сравнивать разность с порогом. Энергетический уровень остаточного сигнала 224 верхнего диапазона может аппроксимировать энергетический уровень гармонически расширенного сигнала 208, если разность ниже порога. Таким образом, в этом случае первый параметр 242 формы коэффициента передачи для первого окна 302 синхронизации может указывать, что масштабирование энергии не является необходимым для соответствующих подкадров гармонически расширенного сигнала 208. Энергетические уровни остаточного сигнала 224 верхнего диапазона для третьих и четвертых окон 306, 308 синхронизации могут также аппроксимировать энергетический уровень соответствующего гармонически расширенного сигнала 208 в третьих и четвертых окнах 306, 308 синхронизации. Таким образом, первые параметры 242 формы коэффициента передачи для третьих и четвертых окон 306, 308 синхронизации могут также указывать, что масштабирование энергии может не являться необходимым для соответствующих подкадров гармонически расширенного сигнала 208.

Энергетический уровень остаточного сигнала 224 верхнего диапазона во втором и пятом окнах 304, 310 синхронизации может колебаться, и соответствующий энергетический уровень гармонически расширенного сигнала 208 во втором и пятом окнах 304, 310 синхронизации может неточно отражать флуктуации остаточного сигнала 224 верхнего диапазона. Первый блок оценки 190 параметров формы коэффициента передачи с фиг. 1-2 может генерировать параметр 242 формы коэффициента передачи во втором и пятом окнах 304, 310 синхронизации для корректировки гармонически расширенного сигнала 208. Например, первый блок 190 оценки формы коэффициента передачи может указывать первому блоку 192 настройки формы коэффициента передачи, что необходимо «масштабировать» гармонически расширенный сигнал 208 во втором и пятом окне 304, 310 синхронизации (например, втором и пятом подкадрах). Величина, на которую корректируется гармонически расширенный сигнал 208, может быть основана на режиме кодирования остаточного сигнала 224 верхнего диапазона. Например, гармонически расширенный сигнал 208 может быть скорректирован на коэффициент (αRHB2)/(αR’LB2), если режим кодирования указывает, что кадр является голосовым кадром. Альтернативно, гармонически расширенный сигнал 208 может быть скорректирован на коэффициент α(RHB)*(R’LB)]/(αR’LB2), если режим кодирования указывает, что кадр является неголосовым кадром.

Энергетический уровень остаточного сигнала 224 верхнего диапазона для шестых и седьмых окон 312, 314 синхронизации может аппроксимировать энергетический уровень соответствующего гармонически расширенного сигнала 208 в шестых и седьмых окнах 312, 314 синхронизации. Таким образом, первые параметры 242 формы коэффициента передачи для шестых и седьмых окон 312, 314 синхронизации могут указывать, что масштабирование энергии не является необходимым для соответствующих подкадров гармонически расширенного сигнала 208.

Генерация параметров 242 формы коэффициента передачи в соответствии с описанным в отношении фиг. 3 может улучшить временное изменение энергии между гармонически расширенным сигналом 208 и остаточным сигналом 224 верхнего диапазона. Например, энергетические флуктуации в остаточном сигнале 224 верхнего диапазона могут быть учтены в гармонически расширенном сигнале 208 посредством его корректировки на основании первых параметров 242 формы коэффициента передачи. Корректировка гармонически расширенного сигнала 208 может сократить звуковые артефакты в области синтеза, как описано в отношении фиг. 4.

Обратимся к фиг. 4, на которой показан конкретный вариант осуществления системы 400, который способен определять вторые параметры формы коэффициента передачи на втором этапе на основании синтезированного сигнала верхнего диапазона и высокочастотной части входного звукового сигнала. Система 400 может содержать синтезатор 402 линейного предсказания (LP), второй блок 194 оценки формы коэффициента передачи, второй блок 196 настройки формы коэффициента передачи и блок 410 оценки кадра коэффициента передачи.

Синтезатор 402 линейного предсказания (LP) может быть сконфигурирован для приема сигнала 161 возбуждения верхнего диапазона и выполнения операции синтеза линейного предсказания на сигнале 161 возбуждения верхнего диапазона для генерации синтезированного сигнала 404 верхнего диапазона. Синтезированный сигнал 404 высокого диапазона может быть предоставлен второму блоку 194 оценки формы коэффициента передачи и второму блоку 196 настройки формы коэффициента передачи.

Второй блок 194 оценки формы коэффициента передачи может быть сконфигурирован для определения вторых параметров 406 формы коэффициента передачи на основании синтезированного сигнала 404 верхнего диапазона и сигнала 124 верхнего диапазона. Например, второй блок 194 оценки формы коэффициента передачи может оценивать энергетические уровни каждого подкадра синтезированного сигнала 404 верхнего диапазона и оценивать энергетические уровни каждого соответствующего подкадра сигнала 124 верхнего диапазона. Например, вторые параметры 406 формы коэффициента передачи могут идентифицировать конкретные подкадры синтезированного сигнала 404 верхнего диапазона, которые имеют более низкие энергетические уровни, чем соответствующие подкадры сигнала 124 верхнего диапазона. Вторые параметры 406 формы коэффициента передачи могут быть определены в области синтеза. Например, вторые параметры 406 формы коэффициента передачи могут быть определены с использованием синтезированного сигнала (например, синтезированного сигнала 404 верхнего диапазона) в противоположность сигналу возбуждения (например, гармонически расширенный сигнал 208) в области возбуждения. Вторые параметры 406 формы коэффициента передачи могут быть переданы второму блоку 196 настройки формы коэффициента передачи и мультиплексору 180 в виде дополнительной информации 172 верхнего диапазона.

Второй блок 196 настройки формы коэффициента передачи может быть сконфигурирован для генерации скорректированного синтезированного сигнала 418 верхнего диапазона на основании вторых параметров 406 формы коэффициента передачи. Например, второй блок 196 настройки формы коэффициента передачи может «масштабировать» конкретные подкадры синтезированного сигнала 404 верхнего диапазона на основании вторых параметров 406 формы коэффициента передачи для генерации скорректированного синтезированного сигнала 418 верхнего диапазона. Второй блок 196 настройки формы коэффициента передачи может «масштабировать» подкадры синтезированного сигнала 404 верхнего диапазона таким же образом, как первый блок 192 настройки формы коэффициента передачи с фиг. 1-2 корректирует конкретные подкадры гармонически расширенного сигнала 208 на основании первых параметров 242 формы коэффициента передачи. Скорректированный синтезированный сигнал 418 верхнего диапазона может быть предоставлен блоку 410 оценки кадра коэффициента передачи.

Блок 410 оценки кадра коэффициента передачи может генерировать параметры 412 кадра коэффициента передачи на основании скорректированного синтезированного сигнала 404 верхнего диапазона и сигнала 124 верхнего диапазона. Параметры 412 кадра коэффициента передачи могут быть переданы мультиплексору 180 в виде дополнительной информации 172 верхнего диапазона.

Система 400 с фиг. 4 может улучшить восстановление верхнего диапазона входного звукового сигнала 102 с фиг. 1 посредством генерации вторых параметров 406 формы коэффициента передачи на основании энергетических уровней синтезированного сигнала 404 верхнего диапазона и соответствующих энергетических уровней сигнала 124 верхнего диапазона. Вторые параметры 406 формы коэффициента передачи могут сократить звуковые артефакты во время восстановления верхнего диапазона входного звукового сигнала 102.

Обратимся к фиг. 5, на которой показан конкретный вариант осуществления системы 500, который способен воспроизводить звуковой сигнал с использованием параметров формы коэффициента передачи. Система 500 содержит генератор 507 нелинейного возбуждения, первый блок 592 настройки формы коэффициента передачи, генератор 520 возбуждения верхнего диапазона, синтезатор 522 линейного предсказания (LP) и второй блок 526 настройки формы коэффициента передачи. В конкретном варианте осуществления система 500 может быть интегрирована в систему или устройство декодирования (например, в беспроводной телефон, CODEC или DSP). В других конкретных вариантах осуществления система 500 может быть интегрирована в телевизионную приставку, музыкальный проигрыватель, видеоплеер, развлекательный модуль, навигационный прибор, коммуникационное устройство, КПК, блок данных фиксированного местоположения или компьютер.

Генератор 507 нелинейного возбуждения может быть сконфигурирован для приема сигнала 144 возбуждения низкого диапазона с фиг. 1. Например, поток 142 битов нижнего диапазона с фиг. 1 может содержать данные, представляющие сигнал 144 возбуждения нижнего диапазона, и может быть передан системе 500 как поток 199 битов. Генератор 507 нелинейного возбуждения может быть сконфигурирован для генерации второго гармонически расширенного сигнала 508 на основании сигнала 144 возбуждения нижнего диапазона. Например, генератор 507 нелинейного возбуждения может выполнять операцию взятия абсолютной величины или операцию возведения в квадрат на кадрах (или подкадрах) сигнала 144 возбуждения нижнего диапазона для генерации второго гармонически расширенного сигнала 508. В конкретном варианте осуществления генератор 507 нелинейного возбуждения может функционировать, по существу, таким же образом, как генератор 207 нелинейного возбуждения с фиг. 2. Второй гармонически расширенный сигнал 508 может быть передан первому блоку 592 настройки формы коэффициента передачи.

Первые параметры формы коэффициента передачи, такие как первые параметры 242 формы коэффициента передачи с фиг. 2, могут также быть переданы первому блоку 592 настройки формы коэффициента передачи. Например, дополнительная информация 172 верхнего диапазона с фиг. 1 может содержать данные, представляющие первые параметры 242 формы коэффициента передачи, и могут быть переданы системе 500. Первый блок 592 настройки формы коэффициента передачи может быть сконфигурирован для корректирования второго гармонически расширенного сигнала 508 на основании первых параметров 242 формы коэффициента передачи для генерации второго скорректированного гармонически расширенного сигнала 544. В конкретном варианте осуществления первый блок 592 настройки формы коэффициента передачи может функционировать, по существу, таким же образом, как первый блок 192 настройки формы коэффициента передачи с фиг. 1-2. Второй скорректированный гармонически расширенный сигнал 544 может быть передан генератору 520 возбуждения верхнего диапазона.

Генератор 520 возбуждения верхнего диапазона может генерировать второй сигнал 561 возбуждения верхнего диапазона на основании второго скорректированного гармонически расширенного сигнала 544. Например, генератор 520 возбуждения верхнего диапазона может содержать систему отслеживания огибающей, блок объединения шума, первый блок объединения, второй блок объединения и блок смешивания. В конкретном варианте осуществления узлы генератора 520 возбуждения верхнего диапазона могут функционировать, по существу, таким же образом, как блок 202 отслеживания огибающей с фиг. 2, блок 240 объединения шума с фиг. 2, первый блок 254 объединения с фиг. 2, второй блок 256 объединения с фиг. 2 и блок 211 смешивания с фиг. 2. Второй сигнал 561 возбуждения верхнего диапазона может быть передан синтезатору 522 линейного предсказания.

Синтезатор 522 линейного предсказания может быть сконфигурирован для приема второго сигнала 561 возбуждения верхнего диапазона и выполнения операции синтеза линейного предсказания на втором сигнале 561 возбуждения верхнего диапазона для генерации второго синтезированного сигнала 524 верхнего диапазона. В конкретном варианте осуществления синтезатор 522 линейного предсказания может функционировать, по существу, таким же образом, как синтезатор 402 линейного предсказания с фиг. 4. Второй синтезированный сигнал 524 верхнего диапазона может быть передан второму блоку 526 настройки формы коэффициента передачи.

Вторые параметры формы коэффициента передачи, такие как вторые параметры 406 формы коэффициента передачи с фиг. 4, могут также быть переданы второму блоку 526 настройки формы коэффициента передачи. Например, дополнительная информация 172 верхнего диапазона с фиг. 1 может содержать данные, представляющие вторые параметры 406 формы коэффициента передачи, и может быть передана системе 500. Второй блок 526 настройки формы коэффициента передачи может быть сконфигурирован для корректировки второго синтезированного сигнала 524 верхнего диапазона на основании вторых параметров 406 формы коэффициента передачи для генерации второго скорректированного синтезированного сигнала 528 верхнего диапазона. В конкретном варианте осуществления второй блок 526 настройки формы коэффициента передачи может функционировать, по существу, таким же образом, как второй блок 196 настройки формы коэффициента передачи с фиг. 1 и 4. В конкретном варианте осуществления второй скорректированный синтезированный сигнал 528 верхнего диапазона может представлять собой воспроизведенную версию сигнала 124 верхнего диапазона с фиг. 1.

Система 500 с фиг. 5 может воспроизвести сигнал 124 верхнего диапазона с использованием сигнала 144 возбуждения верхнего диапазона, первых параметров 242 формы коэффициента передачи и вторых параметров 406 формы коэффициента передачи. Использование параметров 242, 406 формы коэффициента передачи может повысить точность воспроизведения путем корректировки второго гармонически расширенного сигнала 508 и второго синтезированного сигнала 524 верхнего диапазона на основании временных изменений энергии, обнаруженных в устройстве кодирования речи.

Обратимся к фиг. 6, на которой показаны блок-схемы конкретных вариантов осуществления способов 600, 610 использования оценок коэффициента передачи для восстановления верхнего диапазона. Первый способ 600 может быть выполнен системами 100-200 с фиг. 1-2 и системой 400 с фиг. 4. Второй способ 610 может быть выполнен системой 500 с фиг. 5.

Первый способ 600 включает в себя определение, в устройстве кодирования речи, первых параметров формы коэффициента передачи на основании гармонически расширенного сигнала и/или на основании остаточного сигнала верхнего диапазона, ассоциированного с высокочастотной частью звукового сигнала, в 602. Например, первый блок 190 оценки формы коэффициента передачи с фиг. 1 может определять первые параметры формы коэффициента передачи (например, первые параметры 242 формы коэффициента передачи с фиг. 2) на основании гармонически расширенного сигнала (например, гармонически расширенного сигнала 208 с фиг. 2) и/или высокочастотного остатка сигнала 124 верхнего диапазона.

Способ 600 может также включать в себя определение вторых параметров формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и на основании высокочастотной части звукового сигнала, в 604. Например, второй блок 194 оценки формы коэффициента передачи может определять вторые параметры 406 формы коэффициента передачи на основании синтезированного сигнала 404 верхнего диапазона и сигнала 124 верхнего диапазона.

Первые параметры формы коэффициента передачи и вторые параметры формы коэффициента передачи могут быть вставлены в закодированную версию звукового сигнала в целях обеспечения возможности настройки коэффициента передачи во время воспроизведения звукового сигнала из закодированной версии звукового сигнала, в 606. Например, дополнительная информация 172 верхнего диапазона с фиг. 1 может содержать первые параметры 242 формы коэффициента передачи и вторые параметры 406 формы коэффициента передачи. Мультиплексор 180 может вставлять первые параметры 242 формы коэффициента передачи и вторые параметры 406 формы коэффициента передачи в поток 199 битов, и поток 199 битов может быть передан декодирующему устройству (например, системе 500 с фиг. 5). Первый блок 592 настройки формы коэффициента передачи с фиг. 5 может корректировать гармонически расширенный сигнал 508 на основании первого параметра 242 формы коэффициента передачи для генерации второго скорректированного гармонически расширенного сигнала 544. Второй сигнал 561 возбуждения верхнего диапазона, по меньшей мере, частично основан на втором скорректированном гармонически расширенном сигнале 544. Дополнительно, второй блок 526 настройки формы коэффициента передачи с фиг. 5 может корректировать синтезированный сигнал 524 верхнего диапазона на основании вторых параметров 406 формы коэффициента передачи для воспроизведения версии сигнала 124 верхнего диапазона.

Второй способ 610 может включать в себя прием, в устройстве декодирования речи, закодированного звукового сигнала от устройства кодирования речи, в 612. Закодированный звуковой сигнал может содержать первые параметры 242 формы коэффициента передачи, основанные на гармонически расширенном сигнале 208, сгенерированном в устройстве кодирования речи, и/или остаточном сигнале 224 верхнего диапазона, сгенерированном в устройстве кодирования речи. Закодированный звуковой сигнал может также содержать вторые параметры 406 формы коэффициента передачи, основанные на синтезированном сигнале 404 верхнего диапазона и сигнале 124 верхнего диапазона.

Звуковой сигнал может быть воспроизведен из закодированного звукового сигнала на основании первых параметров формы коэффициента передачи и на основании вторых параметров формы коэффициента передачи, в 614. Например, первый блок 592 настройки формы коэффициента передачи с фиг. 5 может корректировать гармонически расширенный сигнал 508 на основании первых параметров 242 формы коэффициента передачи для генерации второго скорректированного гармонически расширенного сигнала 544. Генератор 520 возбуждения верхнего диапазона с фиг. 5 может генерировать второй сигнал 561 возбуждения верхнего диапазона на основании второго скорректированного гармонически расширенного сигнала 544. Синтезатор 522 линейного предсказания может выполнять операцию синтеза линейного предсказания на втором сигнале 561 возбуждения верхнего диапазона для генерации второго синтезированного сигнала 524 верхнего диапазона, и второй блок 526 настройки формы коэффициента передачи может корректировать второй синтезированный сигнал 524 верхнего диапазона на основании вторых параметров 406 формы коэффициента передачи для генерации второго скорректированного синтезированного сигнала 528 верхнего диапазона (например, воспроизведенного звукового сигнала).

Способы 600, 610 фиг. 6 могут улучшить корреляцию энергии подкадров (например, улучшить временное изменение) между гармонически расширенным возбуждением нижнего диапазона звукового сигнала 102 и высокочастотным остатком входного звукового сигнала 102. Например, во время первого этапа настройки коэффициента передачи, первый блок 190 оценки формы коэффициента передачи и первый блок 192 настройки формы коэффициента передачи могут скорректировать гармонически расширенное возбуждение нижнего диапазона на основании первых параметров формы коэффициента передачи для моделирования гармонически расширенного возбуждения нижнего диапазона на основании остатка верхнего диапазона. Способы 600, 610 могут также улучшить корреляцию энергии подкадров между сигналом 124 верхнего диапазона и синтезированной версией сигнала 124 верхнего диапазона. Например, во время второго этапа настройки коэффициента передачи, второй блок 194 оценки формы коэффициента передачи и второй блок 196 настройки формы коэффициента передачи могут корректировать синтезированную версию сигнала 124 верхнего диапазона на основании вторых параметров формы коэффициента передачи для моделирования синтезированной версии сигнала 124 верхнего диапазона на основании сигнала 124 верхнего диапазона.

В конкретных вариантах осуществления способы 600, 610 фиг. 6 могут быть реализованы с помощью аппаратного обеспечения (например, устройства FPGA, ASIC, и т.д.) устройства обработки, такого как центральный процессор (ЦП), цифровой сигнальный процессор (DSP), или контроллер, с помощью программно-аппаратного устройства, или с помощью произвольной комбинации указанного. В качестве примера, способы 600, 610 с фиг. 6 могут быть выполнены процессором, который выполняет инструкции, в соответствии с описанным в отношении фиг. 7.

Обратимся к фиг. 7, на которой изображена блок-схема конкретного иллюстративного варианта осуществления устройства беспроводной связи, обозначенного в целом как 700. Устройство 700 содержит процессор 710 (например, ЦП), соединенный с памятью 732. Память 732 может содержать инструкции 760, исполнимые процессором 710 и/или CODEC 734 для выполнения способов и процессов, раскрытые в настоящем описании, таких как способы 600, 610 с фиг. 6.

В конкретном варианте осуществления CODEC 734 может содержать систему 782 двухэтапной оценки коэффициента передачи и систему 784 двухэтапной настройки коэффициента передачи. В конкретном варианте осуществления система 782 двухэтапной оценки коэффициента передачи содержит один или более узлов системы 100 с фиг. 1, один или более узлов системы 200 с фиг. 2 и/или один или более узлов системы 400 с фиг. 4. Например, система 782 двухэтапной оценки коэффициента передачи может выполнять операции кодирования, ассоциированные с системами 100-200 с фиг. 2, системой 400 с фиг. 4 и способом 600 с фиг. 6. В конкретном варианте осуществления система 784 двухэтапной настройки коэффициента передачи может содержать один или более узлов системы 500 с фиг. 5. Например, система 784 двухэтапной настройки коэффициента передачи может выполнять операции декодирования, ассоциированные с системой 500 с фиг. 5 и способом 610 с фиг. 6. Система 782 двухэтапной оценки коэффициента передачи и/или система 784 двухэтапной настройки коэффициента передачи могут быть реализованы через выделенное аппаратное обеспечение (например, электрические схемы), посредством исполнения процессором инструкций для выполнения одной или более задач, или с помощью комбинации указанного.

В качестве примера, память 732 или память 790 в CODEC 734 могут представлять собой запоминающее устройство, такое как оперативная память (RAM), магнитоустойчивая оперативная память (MRAM), MRAM с передачей момента вращения (STT-MRAM), флэш-память, постоянное запоминающее устройство (ROM), программируемое ПЗУ (PROM), стираемая программируемая постоянная память (EPROM), электрически стираемая программируемая постоянная память (EEPROM), регистры, жесткий диск, съемный диск или ПЗУ на компакт-дисках (CD-ROM). Запоминающее устройство может содержать инструкции (например, инструкции 760 или инструкции 795), которые, при их исполнении компьютером (например, процессором в CODEC 734 и/или процессором 710), могут вызывать выполнение компьютером, по меньшей мере, части одного из способов 600, 610 с фиг. 6. В качестве примера, память 732 или память 790 в CODEC 734 может представлять собой постоянный машиночитаемый носитель, который содержит инструкции (например, инструкции 760 или инструкции 795, соответственно), которые, при их исполнении компьютером (например, процессором в CODEC 734 и/или процессором 710), могут вызывать выполнение компьютером, по меньшей мере, части одного из способов 600, 610 с фиг. 6.

Устройство 700 может также содержать DSP 796, ассоциированный с CODEC 734 и с процессором 710. В конкретном варианте осуществления DSP 796 может содержать систему 797 двухэтапной оценки коэффициента передачи и систему 798 двухэтапной оценки коэффициента передачи. Система 797 двухэтапной оценки коэффициента передачи может содержать один или более узлов системы 100 с фиг. 1, один или более узлов системы 200 с фиг. 2 и/или один или более узлов системы 400 с фиг. 4. Например, система 797 двухэтапной оценки коэффициента передачи может выполнять операции кодирования, ассоциированные с системами 100-200 с фиг. 2, системой 400 с фиг. 4 и способом 600 фиг. 6. Система 798 двухэтапной настройки коэффициента передачи может содержать один или более узлов системы 500 с фиг. 5. Например, система 798 двухэтапной настройки коэффициента передачи может выполнять операции декодирования, ассоциированные с системой 500 с фиг. 5 и способом 610 с фиг. 6. Система 797 двухэтапной оценки коэффициента передачи и/или система 798 двухэтапной настройки коэффициента передачи могут быть реализованы через выделенное аппаратное обеспечение (например, электрические схемы), посредством исполнения процессором инструкций для выполнения одной или более задач, или с помощью комбинации указанного.

На фиг. 7 также показан контроллер 726 дисплея, который соединен с процессором 710 и с дисплеем 728. CODEC 734 может быть соединен с процессором 710, как показано. Динамик 736 и микрофон 738 могут быть соединены с CODEC 734. Например, микрофон 738 может генерировать входной звуковой сигнал 102 с фиг. 1, и CODEC 734 может генерировать выходной поток 199 битов для передачи приемнику на основании входного звукового сигнала 102. В качестве другого примера, динамик 736 может применяться для вывода сигнала, восстановленного CODEC 734 из выходного потока 199 битов с фиг. 1, при этом выходной поток 199 битов принимается от передатчика. На фиг. 7 также указано, что контроллер 740 беспроводной связи может быть соединен с процессором 710 и антенной 742 беспроводной связи.

В конкретном варианте осуществления процессор 710, контроллер 726 дисплея, память 732, CODEC 734, DSP 796 и контроллер 740 беспроводной связи включены в устройство типа «система в корпусе» или «система на кристалле» (например, модем мобильной радиостанции (MSM)) 722. В конкретном варианте осуществления устройство 730 ввода, такое как сенсорный экран и/или клавиатура, и источник питания 744 соединены с устройством 722 типа «система на кристалле». Кроме того, в конкретном варианте осуществления, как проиллюстрировано на фиг. 7, дисплей 728, устройство 730 ввода, динамик 736, микрофон 738, антенна 742 и источник питания 744 являются внешними по отношению к устройству 722 типа «система на кристалле». Однако, каждый элемент из дисплея 728, устройства 730 ввода, динамика 736, микрофона 738, антенны 742 и источника питания 744 может быть соединен с узлом устройства 722 типа «система на кристалле, таким как интерфейс или контроллер.

В связи с описанными вариантами осуществления раскрыто первое устройство, которое содержит средство для определения первых параметров формы коэффициента передачи на основании гармонически расширенного сигнала и/или на основании остаточного сигнала верхнего диапазона, ассоциированного с высокочастотной частью звукового сигнала. Например, средство для определения первых параметров формы коэффициента передачи может содержать первый блок 190 оценки формы коэффициента передачи с фиг. 1-2, модуль 214 идентификации кадра с фиг. 2, систему 782 двухэтапной оценки коэффициента передачи с фиг. 7, систему 797 двухэтапной оценки коэффициента передачи с фиг. 7, одно или более устройств, сконфигурированных для определения первых параметров формы коэффициента передачи (например, процессор, исполняющий инструкции на постоянном машиночитаемом носителе информации), или любую комбинацию указанного.

Первое устройство может также содержать средство для определения вторых параметров формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и на основании высокочастотной части звукового сигнала. Например, средство для определения вторых параметров формы коэффициента передачи может содержать второй блок 194 оценки формы коэффициента передачи с фиг. 1 и 4, систему 782 двухэтапной оценки коэффициента передачи с фиг. 7, систему 797 двухэтапной оценки коэффициента передачи с фиг. 7, одно или более устройств, сконфигурированных для определения вторых параметров формы коэффициента передачи (например, процессор, исполняющий инструкции на постоянном машиночитаемом носителе информации), или любую комбинацию указанного.

Первое устройство может также содержать средство для вставки первых параметров формы коэффициента передачи и вторых параметров формы коэффициента передачи в закодированную версию звукового сигнала в целях обеспечения возможности настройки коэффициента передачи во время воспроизведения звукового сигнала из закодированной версии звукового сигнала. Например, средство для вставки первых параметров формы коэффициента передачи и вторых параметров формы коэффициента передачи в закодированную версию звукового сигнала может содержать мультиплексор 180 с фиг. 1, систему 782 двухэтапной оценки коэффициента передачи с фиг. 7, систему 797 двухэтапной оценки коэффициента передачи с фиг. 7, одно или более устройств, сконфигурированных для вставки первых параметров формы коэффициента передачи в закодированную версию звукового сигнала (например, процессор, исполняющий инструкции на постоянном машиночитаемом носителе информации), или любую комбинацию указанного.

В связи с описанными вариантами осуществления раскрыто второе устройство, которое содержит средство для приема закодированного звукового сигнала от устройства кодирования речи. Закодированный звуковой сигнал содержит первые параметры формы коэффициента передачи, основанные на первом гармонически расширенном сигнале, сгенерированном в устройстве кодирования речи, и основанные на остаточном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи. Закодированный звуковой сигнал также содержит вторые параметры формы коэффициента передачи, основанные на первом синтезированном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи, и основанные на верхнем диапазоне звукового сигнала. Например, средство для приема закодированного звукового сигнала может содержать генератор 507 нелинейного возбуждения с фиг. 5, первый блок 592 оценки формы коэффициента передачи с фиг. 5, второй блок 526 оценки формы коэффициента передачи с фиг. 5, систему 784 двухэтапной настройки коэффициента передачи с фиг. 7, систему 798 двухэтапной настройки коэффициента передачи с фиг. 7, одно или более устройств, сконфигурированных для определения и приема закодированного звукового сигнала (например, процессор, исполняющий инструкции на постоянном машиночитаемом носителе информации), или любую комбинацию указанного.

Второе устройство может также содержать средство для воспроизведения звукового сигнала из кодируемого звукового сигнала на основании первых параметров формы коэффициента передачи и на основании вторых параметров формы коэффициента передачи. Например, средство для воспроизведения звукового сигнала может содержать генератор 507 нелинейного возбуждения с фиг. 5, первый блок 592 оценки формы коэффициента передачи с фиг. 5, генератор 520 возбуждения верхнего диапазона с фиг. 5, синтезатор 522 коэффициентов линейного предсказания с фиг. 5, второй блок 526 оценки формы коэффициента передачи с фиг. 5, систему 784 двухэтапной настройки коэффициента передачи с фиг. 7, систему 798 двухэтапной настройки коэффициента передачи с фиг. 7, одно или более устройств, сконфигурированных для воспроизведения звукового сигнала (например, процессор, исполняющий инструкции на постоянном машиночитаемом носителе информации), или любую комбинацию указанного.

Специалистам будет также понятно, что различные иллюстративные логические блоки, конфигурации, модули, схемы и этапы алгоритмов, описанные в связи с вариантами осуществления, раскрытыми в настоящем описании, могут быть реализованы как электронное аппаратное обеспечение, программное обеспечение, выполняемое устройством обработки, таким как аппаратный процессор, или как комбинация того и другого. Различные иллюстративные узлы, блоки, конфигурации, модули, схемы и этапы были описаны выше в общем смысле с точки зрения их функциональности. Будет ли такая функциональность реализована как аппаратное обеспечение или как исполнимое программное обеспечение, зависит от конкретного применения и конструктивных ограничений, наложенных на систему в целом. Специалисты в данной области техники могут реализовать описанную функциональность различными способами для каждого конкретного применения, но такие решения по реализации не должны интерпретироваться как вызывающие отклонение от объема настоящего раскрытия.

Этапы способа или алгоритма, описанные в связи с вариантами осуществления, раскрытыми в настоящем описании, могут быть воплощены непосредственно в аппаратном обеспечении, в модуле программного обеспечения, выполняемом процессором, или в комбинации того и другого. Модуль программного обеспечения может находиться в запоминающем устройстве, таком как оперативная память (RAM), магнитоустойчивая оперативная память (MRAM), MRAM с передачей момента вращения (STT-MRAM), флэш-память, постоянное запоминающее устройство (ROM), программируемое ПЗУ (PROM), стираемая программируемая постоянная память (EPROM), электрически стираемая программируемая постоянная память (EEPROM), регистры, жесткий диск, съемный диск или ПЗУ на компакт-дисках (CD-ROM). Типовое запоминающее устройство соединено с процессором таким образом, что процессор может читать информацию из запоминающего устройства и записывать информацию в него. В качестве альтернативы, запоминающее устройство может являться неотъемлемой частью процессора. Процессор и запоминающее устройство могут размещаться в ASIC. ASIC может находиться в вычислительном устройстве или пользовательском терминале. В качестве альтернативы, процессор и запоминающее устройство могут размещаться в качестве отдельных узлов в вычислительном устройстве или пользовательском терминале.

Предшествующее описание раскрытых вариантов осуществления представлено для обеспечения специалисту в данной области техники возможности сделать или применить раскрытые варианты осуществления. Различные изменения в этих вариантах осуществления будут очевидны специалистам в данной области техники и принципы, определенные в настоящем описании, могут быть применены к другим вариантам осуществления без отступания от объема раскрытия. Таким образом, не предполагается, что настоящее раскрытие ограничено вариантами осуществления, показанными в настоящем описании, но оно должно рассматриваться в соответствии с самым широким возможным объемом, согласующимся с принципами и новыми характеристиками в соответствии с определенным в приведенной ниже формуле изобретения.

1. Способ обработки сигналов, включающий в себя:

выполнение первого определения, в устройстве кодирования речи, первых параметров формы коэффициента передачи на основании по меньшей мере частично энергетических уровней первого множества подкадров гармонически расширенного сигнала, на основании по меньшей мере частично энергетических уровней второго множества подкадров остаточного сигнала верхнего диапазона, ассоциированного с высокочастотной частью звукового сигнала, или любой комбинации указанного;

генерацию сигнала возбуждения верхнего диапазона на основании по меньшей мере частично первых параметров формы коэффициента передачи;

генерацию синтезированного сигнала верхнего диапазона на основании сигнала возбуждения верхнего диапазона;

выполнение второго определения вторых параметров формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и на основании высокочастотной части звукового сигнала и

вставку первых параметров формы коэффициента передачи и вторых параметров формы коэффициента передачи в закодированную версию звукового сигнала.

2. Способ обработки сигналов по п. 1, в котором первое определение выполняют на первом этапе оценки формы коэффициента передачи, второе определение выполняют на втором этапе оценки формы коэффициента передачи, и при этом второй этап оценки формы коэффициента передачи отличается от первого этапа оценки формы коэффициента передачи.

3. Способ обработки сигналов по п. 1, в котором первое определение, второе определение и вставку выполняют в устройстве, которое содержит устройство мобильной связи.

4. Способ обработки сигналов по п. 1, в котором первые параметры формы коэффициента передачи определены в области остатка линейного предсказания,

в котором вторые параметры формы коэффициента передачи определены в области синтеза линейного предсказания и

в котором гармонически расширенный сигнал генерируется из низкочастотной части звукового сигнала посредством нелинейного гармонического расширения.

5. Способ обработки сигналов по п. 1, дополнительно включающий в себя:

корректировку гармонически расширенного сигнала на основании первых параметров формы коэффициента передачи для генерации измененного гармонически расширенного сигнала;

при этом генерирование сигнала возбуждения верхнего диапазона по меньшей мере частично основано на измененном гармонически расширенном сигнале,

выполнение операции синтеза линейного предсказания на сигнале возбуждения верхнего диапазона для генерации синтезированного сигнала верхнего диапазона и настройки синтезированного сигнала верхнего диапазона на основе вторых параметров формы коэффициента передачи.

6. Способ обработки сигналов по п. 5, в котором сигнал возбуждения верхнего диапазона генерируется на основе измененного гармонически расширенного сигнала и на основе модулированного шумового сигнала.

7. Способ обработки сигналов по п. 1, дополнительно включающий в себя:

дискретизацию кадра нижнего диапазона гармонически расширенного сигнала для генерации первого множества подкадров

или дискретизацию соответствующего кадра верхнего диапазона остаточного сигнала верхнего диапазона для генерации второго множества подкадров.

8. Способ обработки сигналов по п. 7, в котором корректировка гармонически расширенного сигнала включает в себя масштабирование конкретного подкадра из первого множества подкадров для аппроксимации энергетического уровня соответствующего подкадра из второго множества подкадров.

9. Способ обработки сигналов по п. 7, в котором второе множество подкадров содержит первое число подкадров в случае, если было определено, что кадр верхнего диапазона представляет собой голосовой кадр, и в котором второе множество подкадров содержит второе число подкадров, которое меньше, чем первое число подкадров, в случае, если было определено, что кадр верхнего диапазона не является голосовым кадром.

10. Способ обработки сигналов по п. 7, в котором первое множество подкадров и второе множество подкадров содержат одно и то же число подкадров и для голосового кадра, и для неголосового кадра, при этом первое множество подкадров и второе множество подкадров содержат четыре подкадра, если основная частота дискретизации нижнего диапазона составляет 12,8 килогерц (кГц), и при этом первое множество подкадров и второе множество подкадров содержат пять подкадров, если основная частота дискретизации нижнего диапазона составляет 16 кГц.

11. Способ обработки сигналов по п. 1, в котором первое определение, второе определение и вставка выполняются в устройстве, содержащем блок данных фиксированного местоположения.

12. Устройство обработки сигналов, содержащее:

первый блок оценки формы коэффициента передачи, сконфигурированный для определения первых параметров формы коэффициента передачи на основании по меньшей мере частично энергетических уровней первого множества подкадров гармонически расширенного сигнала, на основании по меньшей мере частично энергетических уровней второго множества подкадров остаточного сигнала верхнего диапазона, ассоциированного с высокочастотной частью звукового сигнала, или любой комбинации указанного;

генератор возбуждения верхнего диапазона, сконфигурированный для генерации сигнала возбуждения верхнего диапазона на основании первых параметров формы коэффициента передачи;

синтезатор линейного предсказания, сконфигурированный для выполнения операции синтеза коэффициентов линейного предсказания на сигнале возбуждения верхнего диапазона для генерации синтезированного сигнала верхнего диапазона;

второй блок оценки формы коэффициента передачи, сконфигурированный для определения вторых параметров формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и на основании высокочастотной части звукового сигнала; и

электрическую схему, сконфигурированную для вставки первых параметров формы коэффициента передачи и вторых параметры формы коэффициента передачи в закодированную версию звукового сигнала.

13. Устройство обработки сигналов по п. 12, в котором первые параметры формы коэффициента передачи определены в области остатка линейного предсказания,

в котором электрическая схема содержит мультиплексор и

в котором гармонически расширенный сигнал генерируется из низкочастотной части звукового сигнала посредством нелинейного гармонического расширения.

14. Устройство обработки сигналов по п. 12, дополнительно содержащее антенну и приемник, соединенный с антенной и сконфигурированный для приема звукового сигнала.

15. Устройство обработки сигналов по п. 14, дополнительно содержащее процессор, соединенный с первым блоком оценки формы коэффициента передачи, вторым блоком оценки формы коэффициента передачи, электрической схемой и приемником, при этом процессор включен в устройство мобильной связи.

16. Устройство обработки сигналов по п. 14, дополнительно содержащее процессор, соединенный с первым блоком оценки формы коэффициента передачи, вторым блоком оценки формы коэффициента передачи, электрической схемой и приемником, при этом процессор включен в блок данных фиксированного местоположения.

17. Устройство обработки сигналов по п. 12, дополнительно содержащее первый блок настройки коэффициента передачи, сконфигурированный для корректировки гармонически расширенного сигнала на основании первых параметров формы коэффициента передачи для генерации измененного гармонически расширенного сигнала,

причем первый блок оценки формы коэффициента передачи дополнительно сконфигурирован для:

дискретизации кадра нижнего диапазона гармонически расширенного сигнала для генерации первого множества подкадров

или дискретизации соответствующего кадра верхнего диапазона остаточного сигнала верхнего диапазона для генерации второго множества подкадров.

18. Устройство обработки сигналов по п. 17, в котором первое множество подкадров содержит первое число подкадров в случае, если было определено, что кадр верхнего диапазона представляет собой голосовой кадр, и в котором первое множество подкадров содержит второе число подкадров, которое меньше первого числа подкадров, в случае, если было определено, что кадр верхнего диапазона является неголосовым кадром.

19. Устройство обработки сигналов по п. 17, в котором первое множество подкадров содержит шестнадцать подкадров в случае, если было определено, что кадр верхнего диапазона представляет собой голосовой кадр.

20. Устройство обработки сигналов по п. 17, в котором генератор возбуждения верхнего диапазона сконфигурирован для генерирования сигнала возбуждения верхнего диапазона на основании измененного гармонически расширенного сигнала и на основе модулированного шумового сигнала.

21. Устройство обработки сигналов по п. 12, дополнительно содержащее первый блок настройки коэффициента передачи, сконфигурированный для корректировки гармонически расширенного сигнала на основании кадра нижнего диапазона гармонически расширенного сигнала, и второй блок настройки коэффициента передачи, сконфигурированный для корректировки синтезированного сигнала верхнего диапазона на основании вторых параметров формы коэффициента передачи.

22. Способ обработки сигналов, включающий в себя:

прием, в устройстве декодирования речи, закодированного звукового сигнала от устройства кодирования речи, при этом закодированный звуковой сигнал содержит:

первые параметры формы коэффициента передачи, основанные на первом определении, причем первое определение основано на по меньшей мере частично энергетических уровнях первого множества подкадров первого гармонически расширенного сигнала, генерированного в устройстве кодирования речи, основанные на по меньшей мере частично энергетических уровнях второго множества подкадров остаточного сигнала верхнего диапазона, генерированного в устройстве кодирования речи, или любой комбинации указанного; и

вторые параметры формы коэффициента передачи, основанные на втором определении, причем второе определение основано на первом синтезированном сигнале верхнего диапазона, генерированном в устройстве кодирования речи, и основанные на части верхнего диапазона звукового сигнала, при этом первый синтезированный сигнал верхнего диапазона основан на первом сигнале возбуждения верхнего диапазона, который основан на по меньшей мере частично первых параметрах формы коэффициента передачи; и

воспроизведение звукового сигнала из кодируемого звукового сигнала на основании первых параметров формы коэффициента передачи и на основании вторых параметров формы коэффициента передачи.

23. Способ обработки сигналов по п. 22, в котором воспроизведение звукового сигнала в устройстве декодирования речи включает в себя:

генерацию второго гармонически расширенного сигнала на основании нелинейного расширения возбуждения нижнего диапазона закодированного звукового сигнала;

корректировку второго гармонически расширенного сигнала на основании первых параметров формы коэффициента передачи для получения измененного второго гармонически расширенного сигнала;

генерацию второго сигнала возбуждения верхнего диапазона на основании второго измененного гармонически расширенного сигнала;

выполнение операции синтеза линейного предсказания на втором сигнале возбуждения верхнего диапазона для генерации второго синтезированного сигнала верхнего диапазона и

корректировку второго синтезированного сигнала верхнего диапазона на основании вторых параметров формы коэффициента передачи.

24. Способ обработки сигналов по п. 22, в котором прием и воспроизведение выполняют в устройстве, которое содержит устройство мобильной связи.

25. Способ обработки сигналов по п. 22, в котором прием и воспроизведение выполняют в устройстве, которое содержит блок данных фиксированного местоположения.

26. Система обработки сигналов, включающая в себя устройство декодирования речи, сконфигурированное для:

приема закодированного звукового сигнала от устройства кодирования речи, при этом закодированный звуковой сигнал содержит:

первые параметры формы коэффициента передачи, основанные на первом определении, причем первое определение основано на по меньшей мере частично энергетических уровнях первого множества подкадров первого гармонически расширенного сигнала, генерированного в устройстве кодирования речи, основанные на по меньшей мере частично энергетических уровнях второго множества подкадров остаточного сигнала верхнего диапазона, генерированного в устройстве кодирования речи, или любой комбинации указанного; и

вторые параметры формы коэффициента передачи, основанные на втором определении, причем второе определение основано на первом синтезированном сигнале верхнего диапазона, генерированном в устройстве кодирования речи, и основанные на части верхнего диапазона звукового сигнала, при этом первый синтезированный сигнал верхнего диапазона основан на первом сигнале возбуждения верхнего диапазона, который основан на по меньшей мере частично первых параметрах формы коэффициента передачи; и

воспроизведения звукового сигнала из кодируемого звукового сигнала на основании первых параметров формы коэффициента передачи и на основании вторых параметров формы коэффициента передачи.

27. Система обработки сигналов по п. 26, дополнительно содержащая

антенну и приемник, соединенный с антенной и сконфигурированный для приема звукового сигнала.

28. Система обработки сигналов по п. 27, дополнительно содержащая процессор, соединенный с приемником, при этом процессор включен в устройство мобильной связи.

29. Система обработки сигналов по п. 27, дополнительно содержащая процессор, соединенный с приемником, при этом процессор включен в блок данных фиксированного местоположения.

30. Система обработки сигналов по п. 26, дополнительно содержащая генератор нелинейного возбуждения, сконфигурированный для генерации второго гармонически расширенного сигнала на основании возбуждения нижнего диапазона закодированного звукового сигнала;

первый блок настройки коэффициента передачи, сконфигурированный для корректировки второго гармонически расширенного сигнала на основании первых параметров формы коэффициента передачи для получения измененного второго гармонически расширенного сигнала; и

генератор возбуждения верхнего диапазона, сконфигурированный для генерации второго сигнала возбуждения верхнего диапазона на основании измененного второго гармонически расширенного сигнала.



 

Похожие патенты:

Изобретение относится к средствам для выполнения шумовой модуляции и регулировки усиления. Технический результат заключается в повышении качества сигнала за счет компенсации зашумления и искажения вследствие ошибок квантования.

Изобретение относится к вводу данных в электронное устройство и обработке голосового запроса, введенного в электронное устройство. Технический результат - обеспечение обработки голосовых запросов пользователя для заполнения частей интерфейса в пользовательских приложениях с помощью понимания естественного языка (NLU) текста, который был распознан в голосовом запросе пользователя, без необходимости вручную выбирать, какую конкретно часть интерфейса пользователь хочет заполнить с помощью голоса.

Изобретение относится к обработке аудиосигнала. Технический результат изобретения заключается в снижении вычислительной сложности процесса обработки аудиосигнала, требующего сниженных ресурсов памяти.

Изобретение относится к кодированию/декодированию аудио сигналов и, в частности, к кодированию аудиосигналов с использованием интеллектуального заполнения интервалов отсутствия сигнала.

Изобретение относится к средствам для обработки звукового сигнала с использованием сигнала ошибки вследствие наложения спектров. Технический результат заключается в повышении эффективности обработки аудиосигнала.

Изобретение относится к средствам для декодирования кодированного аудиосигнала. Технический результат заключается в обеспечении возможности кодирования аудиосигналов в широком диапазоне скоростей передачи битов.

Изобретение относится к средствам для предсказания сигнала возбуждения верхней полосы частот. Технический результат заключается в повышении качества сигнала возбуждения верхней полосы.

Изобретение относится к средствам для кодирования и декодирования звукового сигнала. Технический результат заключается в повышении эффективности кодирования и декодирования аудиосигнала.

Изобретение относится к средствам для аудиокодирования и аудиодекодирования. Технический результат заключается в снижении искажения компонента частотного диапазона, кодированного с малым числом битов во временной области.

Изобретение относится к средствам для кодирования и декодирования речи. Технический результат заключается в уменьшении опережающего и запаздывающего эха.

Изобретение относится к средствам для маскирования ошибок при кодировании/декодировании аудио. Технический результат заключается в восстановлении качества звучания без увеличения алгоритмической задержки, когда происходит потеря пакета при кодировании аудио.

Изобретение относится к средствам для определения режима кодирования и для кодирования/декодирования аудиосигналов. Технический результат заключается в сокращении задержек, вызванных частым изменением режима кодирования.

Изобретение относится к средствам кодирования и декодирования аудиосигнала. Технический результат заключается в повышении эффективности кодирования аудио, включающего речевые и неречевые части, за счет повышения эффективности кодирования переходов между данными частями.

Группа изобретений относится к устройствам и способам кодирования и декодирования аудиосигнала с удалением алиасинга (наложения спектров). Техническим результатом является нейтрализация артефактов алиасинга при прохождении через декодер аудиосигнала.

Изобретение относится к средствам генерирования шума в аудиокодеках. Технический результат заключается в обеспечении уменьшения скорости передачи битов и в повышении качества генерируемого шума.

Изобретение относится к средствам кодирования и декодирования. Технический результат заключается в повышении качества аудиосигнала.

Изобретение относится к способу кодирования аудио сигнала и средствам для осуществления этого способа. Технический результат изобретения заключается в создании концепции кодирования, позволяющей уменьшить сложность при сопоставимой или даже увеличенной эффективности кодирования.

Изобретение относится к кодеку, поддерживающему переключение между режимом кодирования с преобразованием с подавлением помех дискретизации во временной области и режимом кодирования временной области.

Изобретение относится к средствам кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра. Технический результат заключается в повышении качества кодированного аудиосигнала.

Изобретение относится к средствам для расширения полосы частот. Технический результат заключается в улучшении восприятия расширенного звукового сигнала.

Изобретение относится к средствам для выполнения шумовой модуляции и регулировки усиления. Технический результат заключается в повышении качества сигнала за счет компенсации зашумления и искажения вследствие ошибок квантования.
Наверх