Аудиодекодер, поддерживающий набор разных инструментов маскирования потерь

Авторы патента:

РАВЕЛЛИ, Эммануэль (DE)

ШНАБЕЛЬ, Михаэль (DE)

ШПЕРШНАЙДЕР, Ральф (DE)

ШНЕЛЛЬ, Маркус (DE)

ТОМАСЕК, Адриан (DE)

ЧЕКАЛИНСКИЙ, Александр (DE)

G10L25/81 - Анализирование или синтезирование речи; распознавание речи (ввод/вывод звука для компьютеров G06F 3/16; способы или устройства для обработки цифровых данных, специально предназначенных для манипулирования данными на естественном языке G06F 17/20; обучение или общение со слепыми, глухими или немыми G09B 21/00; телефонная связь H04M)

G10L19/005 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2759092:

ФРАУНХОФЕР-ГЕЗЕЛЛЬШАФТ ЦУР ФЕРДЕРУНГ ДЕР АНГЕВАНДТЕН ФОРШУНГ Е.Ф. (DE)

Заявленная группа изобретений относится к аудиодекодеру, поддерживающему набор разных инструментов маскирования потерь. Техническим результатом настоящего изобретения является создание принципа аудиодекодирования, который позволяет аудиодекодеру, содержащему набор разных инструментов маскирования потерь, достичь улучшенного маскирования потерь. Назначение одного из фазового набора разных инструментов маскирования потерь аудиодекодера участку аудиосигнала, подлежащему декодированию из потока данных, причем этот участок подвержен потере, то есть выбор из набора разных инструментов маскирования потерь может осуществляться таким образом, что маскирование потерь будет более приятным, если осуществлять назначение/выбор на основании двух мер: первая определяемая мера измеряет спектральное положение спектрального центроида спектра аудиосигнала и вторая определяемая мера измеряет временную предсказуемость аудиосигнала. Затем назначенный или выбранный инструмент маскирования потерь может использоваться для восстановления участка аудиосигнала. 7 н. и 16 з.п. ф-лы, 8 ил.

Настоящее изобретение относится к аудиодекодеру, поддерживающему набор разных инструментов маскирования потерь.

Маскирование потерь пакетов (PLC) используется в аудиокодеках для маскирования потерянных или поврежденных пакетов при передаче с кодера на декодер. PLC осуществляется на стороне декодера и работает путем экстраполяции декодированного сигнала либо в области преобразования, либо во временной области. В идеале, замаскированный сигнал не должен содержать артефактов и должен иметь те же спектральные характеристики, что и пропущенный сигнал.

Устойчивые к ошибкам аудиокодеки, как описано в [2] и [4], в общем случае пользуются множеством способов маскирования для различных типов сигнала, например, речи в качестве монофонического сигнала, музыки в качестве полифонического сигнала или шумового сигнала. Выбор основан на наборе признаков сигнала, которые либо передаются и декодируются из битового потока, либо оцениваются на декодере.

Методы PLC на основе основного тона в общем случае дают хорошие результаты для речевых и монофонических сигналов. Эти подходы предполагают, что сигнал является локально стационарным, и восстанавливают потерянный сигнал, синтезируя периодический сигнал с использованием экстраполированного периода основного тона. Эти методы широко используются при кодировании речи на основе CELP, например, в ITU-T G.718 [2]. Их также можно использовать для кодирования методом PCM, например, в ITU-T G.711 [3] и в последнее время они применяются к кодированию аудиосигнала на основе DECT, наилучшим примером которого является маскирование TCX во временной области, TCX TD-PLC, по стандарту 3GPP EVS [4].

Отставание основного тона является основным параметром, используемым в PLC на основе основного тона. Этот параметр можно оценивать на стороне кодера и кодировать в битовый поток. В этом случае отставание основного тона последнего хорошего кадра используется для маскирования текущего потерянного кадра, например, в [2] и [4]. В отсутствие отставания основного тона в битовом потоке, его можно оценивать на стороне декодера, выполняя алгоритм обнаружения основного тона на декодированном сигнале, например в [3].

Было установлено, что для непериодических, нетональных, шумоподобных сигналов эффективен несложный метод, именуемый повторением кадра со знаковым скремблированием. Он базируется на повторении последнего кадра и умножении спектральных коэффициентов с произвольно сформированным знаком для маскирования потерянного кадра. Один пример повторения кадра MDCT со знаковым скремблированием можно найти в стандарте 3GPP EVS [4].

Для тональных полифонических сигналов или сложных музыкальных сигналов используется способ, который базируется на предсказании фазы спектральных коэффициентов любой обнаруженной тональной компоненты. Этот способ демонстрирует заметное улучшение для стационарных тональных сигналов. Тональная компонента состоит из пика, который также присутствовал в ранее принятом(ых) кадре(ах). Фаза спектральных коэффициентов, принадлежащих тональным компонентам, определяется из спектра мощности последнего(их) принятого(ых) кадра(ов). Один пример тонального маскирования MDCT можно найти в стандарте 3GPP EVS [4].

В итоге, известны разные способы PLC, но они пригодны для определенных ситуаций, т.е. для определенных характеристик аудиосигнала. Таким образом, аудиокодер, поддерживающий несколько таких способов PLC, должен иметь механизм для выбора наиболее пригодного способа PLC, когда происходит потеря кадра или пакета. Наиболее пригодным способом PLC является тот, что приводит к наименее заметному заменителю потерянного сигнала.

Задача настоящего изобретения состоит в создании принципа аудиодекодирования, который позволяет аудиодекодеру, содержащему набор разных инструментов маскирования потерь, достичь улучшенного маскирования потерь.

Решение этой задачи является предметом независимых пунктов формулы изобретения настоящего изобретения.

Идея настоящего изобретения состоит в том, что назначение одного из фазового набора разных инструментов маскирования потерь аудиодекодера участку аудиосигнала, подлежащему декодированию из потока данных, причем этот участок подвержен потере, то есть выбор из набора разных инструментов маскирования потерь, может осуществляться таким образом, что маскирование потерь будет более приятным, если осуществлять назначение/выбор на основании двух мер: первая определяемая мера измеряет спектральное положение спектрального центроида спектра аудиосигнала, и вторая определяемая мера измеряет временную предсказуемость аудиосигнала. Затем назначенный или выбранный инструмент маскирования потерь может использоваться для восстановления участка аудиосигнала.

Например, на основании вышеупомянутых первой и второй мер, потерянному участку может назначаться один из первого и второго инструментов маскирования потерь, причем первый выполнен с возможностью восстановления аудиосигнала путем синтеза аудиосигнала с использованием периодического сигнала, периодичность которого зависит от значения основного тона, выведенного из потока данных, и второй инструмент маскирования потерь может быть выполнен с возможностью восстановления аудиосигнала путем обнаружения тональных спектральных компонент аудиосигнала, осуществления обнаружения фазы на тональных спектральных компонентах и синтеза аудиосигнала путем объединения сигналов, периодичности которых зависят от тональных спектральных компонент при регулировке взаимного сдвига фазы между сигналами в зависимости от обнаружения фазы. Другими словами, на основании первой и второй мер, потерянному участку может назначаться один из инструмента тонального PLC в частотной области и инструмента тонального PLC во временной области.

В соответствии с вариантом осуществления, назначение/выбор для потерянного участка осуществляется поэтапно: определяется третья мера, измеряющая тональность спектра аудиосигнала, и один из первого и второго поднаборов одного или более инструментов маскирования потерь из набора разных инструментов маскирования потерь назначается потерянному участку, и только если первый поднабор одного или более инструментов маскирования потерь назначается потерянному участку, назначение одного инструмента PLC для потерянного участка осуществляется на основании первой и второй мер из этого первого поднабора. В противном случае, назначение/выбор осуществляется из второго поднабора.

Предпочтительные аспекты настоящего изобретения представлены в зависимых пунктах формулы изобретения. Предпочтительные варианты осуществления настоящего изобретения изложены ниже с обращением к чертежам, на которых:

фиг. 1 - блок-схема аудиодекодера в соответствии с вариантом осуществления настоящего изобретения;

фиг. 2 - блок-схема режима работы блока 32 назначения аудиодекодера, показанного на фиг. 1 в соответствии с вариантом осуществления;

фиг. 3 - схема, демонстрирующая обнаружение спектрального центроида для определения первой меры для назначения PLC на фиг. 2 в соответствии с вариантом осуществления;

фиг. 4 - схема, демонстрирующая обнаружение временной предсказуемости для определения второй меры для назначения PLC на фиг. 2 в соответствии с вариантом осуществления;

фиг. 5 - схема, демонстрирующая режим работы PLC 1, показанный на фиг. 2;

фиг. 6 - схема, демонстрирующая режим работы PLC 2 в соответствии с вариантом осуществления;

фиг. 7 - блок-схема модифицированной версии операции назначения, показанной на фиг. 2, расширенной для осуществления назначения из набора инструментов PLC для маскирования потерь пакетов PLC 1 - PLC 3 в соответствии с вариантом осуществления; и

фиг. 8 - дерево решений для выбора из трех инструментов PLC, причем дереву решений соответствует вариант осуществления на фиг. 7.

На фиг. 1 показан аудиодекодер в соответствии с вариантом осуществления настоящего изобретения. Как показано здесь, аудиодекодер 10 выполнен с возможностью декодирования аудиосигнала 12 из потока 14 данных. Аудиосигнал 12 может кодироваться в поток 14 данных в соответствии с любым пригодным аудиокодеком, например, аудиокодеком временной области или аудиокодеком частотной области. Аудиосигнал 12 может кодироваться в поток 14 данных в единицах временных участков 16 кадров 18, соответственно. Точнее говоря, аудиосигнал 12 может подразделяться во времени на перекрывающиеся или неперекрывающиеся временные участки или интервалы 16, каждый из которых соответствует некоторому одному из кадров 18, на которые подразделяется поток 14 данных. Каждый кадр 18 кодирует соответствующий временной участок 16. Например, участок 18 может содержать информацию о коэффициентах линейного предсказания, описывающих спектральную огибающую аудиосигнала на соответствующем участке 16. Кроме того, в кадре 18 могут кодироваться спектральные коэффициенты, описывающие спектр аудиосигнала 12 на участке 16, которому придана определенная форма, например, аудиодекодером 10 согласно коэффициентам линейного предсказания, содержащимся в этом кадре. Процесс суммирования с перекрытием также может применяться аудиодекодером 10 в реконструкции аудиосигнала 12 из потока 14 данных. Естественно, возможности также будут применяться с представленными здесь примерами, служащими лишь для облегчения понимания.

Поток 14 данных может приниматься аудиодекодером 10 в пакетированной форме, т.е. в единицах пакетов. Подразделение потока 14 данных в кадр 18 само по себе представляет разновидность пакетизации, т.е. кадры 18 представляют пакеты. Кроме того, поток 14 данных может упаковываться в пакеты транспортного потока или формата медиафайла, но это обстоятельство здесь более подробно не рассматривается. Напротив, достаточно утверждать, что прием потока 14 данных аудиодекодером 10 подвержен потере данных или сигнала, именуемой в дальнейшем потерей пакетов. Таким образом, некоторый непрерывный участок 20 потока 14 данных неизбежно теряется в ходе передачи, и поэтому не принимается аудиодекодером 10, из-за чего соответствующий участок пропускается и не доступен аудиодекодеру 10. В результате, аудиодекодер 10 пропускает информацию в потоке 14 данных для реконструкции участка 22, соответствующего участку 20. Другими словами, аудиодекодер 10 не способен реконструировать участок 22 из потока 14 данных в соответствии с нормальным процессом аудиодекодирования, реализованным, например, в ядре 24 аудиодекодирования аудиодекодера, при пропускании участка 20 потока 14 данных. Напротив, для обработки таких пропущенных участков 20, аудиодекодер 10 содержит набор 26 инструментов 28 PLC для восстановления или синтеза аудиосигнала 12 на участке 22 заменяющим сигналом 30. Инструменты 28 PLC, содержащиеся в наборе 26, отличаются пригодностью для разных характеристик аудиосигнала. Таким образом, степень раздражения при использовании некоторого инструмента PLC для восстановления заменяющего сигнала 30 в некотором участке 22 аудиосигнала 12 зависит от характеристики аудиосигнала на этом участке 22, и инструменты 28 PLC в наборе 26 демонстрируют отличающиеся друг от друга степени раздражения для некоторого набора характеристик аудиосигнала. Соответственно, аудиодекодер 10 содержит блок 32 назначения, который назначает один из набора 26 инструментов 28 маскирования потерь пакетов участку 22 аудиосигнала 12, который подвержен потере пакетов, например, потерянному участку 22 потока 14 данных. Блок 32 назначения пытается назначить участку 22 наилучший инструмент 28 PLC, а именно, тот, который приводит к наименьшему раздражению.

После того, как блок 32 назначения назначает некоторый инструмент 28 PLC потерянному участку 22 аудиосигнала 12, аудиодекодер 10 восстанавливает этот участок 22 аудиосигнала с использованием назначенного инструмента 28 PLC, таким образом, заменяя аудиосигнал 12 этим участком 22, как он реконструировался бы из потока 14 аудиоданных, если бы соответствующий участок потока данных 22 не был потерян, заменяющим сигналом 30, полученным с использованием инструмента 28 PLC, назначенного для участка 22 блоком 32 назначения.

Как уже указано выше, назначение конкретного инструмента 28 PLC тому или иному потерянному участку 22 должно производиться в зависимости от сигнала, чтобы маскирование потери вызывало наименьшее раздражение. Однако зависимость от сигнала ограничивается участками потока 14 данных, предшествующими потерянному участку 20 потока данных и, в соответствии с описанным здесь вариантом осуществления, блок 32 назначения действует следующим образом.

Для более подробного объяснения, обратимся к фиг. 2. На фиг. 2 показано, что весь процесс назначения некоторого пропущенного участка 22 может инициироваться блоком 34 обнаружения потерь, возможно присутствующим в аудиодекодере 10. В частности, если обнаружение 36 потери, осуществляемое блоком 34 обнаружения потерь, устанавливает, что некоторый участок 20 потока 14 данных пропущен или потерян, что обозначено позицией 38, инициируется следующий процесс назначения. Определение 40 осуществляется для определения первой мере 42, которая измеряет спектральное положение спектрального центроида спектра аудиосигнала. Таким образом, блок 32 назначения определяет спектральное положение центра масс спектра аудиосигнала, см. фиг. 3. Аудиодекодер извлекает из участка 44, предшествующего потерянному участку 20 потока 14 данных, предшествующего в порядке потока данных, спектр 46 аудиосигнала. Как описано выше с обращением к фиг. 1, возможно, что в поток 14 данных так или иначе кодирован аудиосигнал 12 в спектральной области, благодаря чему, спектрального разложения не требуется блоку 32 назначения для получения спектра 46. Например, спектральные коэффициенты самого последнего принятого кадра 18 или более чем один самый последний извлеченный кадр 18 потока 14 данных, до потерянного участка 20, используется для получения спектра 46. Если используется более чем один кадр 18, возможно, что спектр 46, используемый блоком 32 назначения, получается путем усреднения. Для осуществления определения 40, определяется центр масс этого спектра 46, т.е. мера 42, измеряющая спектральное положение 48 спектра 46. Далее приводится конкретный пример.

Кроме того, процесс назначения, инициируемый обнаружением потерь, содержит определение 50 временной предсказуемости аудиосигнала для получения меры 52 этой временной предсказуемости, подробности см. фиг. 4. Как показано здесь, в соответствии с вариантом осуществления, обнаружение 50 временной предсказуемости может опираться на декодированный сигнал или аудиосигнал 12, выводимый из потока 14 данных до пропущенного участка 22 сигнала по причине потери участка 20 потока 14 данных. Другими словами, обнаружение 50 временной предсказуемости может базироваться на аудиосигнале 12 на участке 50, который непосредственно предшествует потерянному участку 22, потерю которого нужно замаскировать, и который декодируется из участка 44 потока 14 данных. Обнаружение 50 временной предсказуемости может осуществляться таким образом, что мера 52 является мерой самоподобия или автокорреляции участка 50 сигнала, что обозначено позицией 54 на фиг. 4. Взаимный сдвиг s, для которого самоподобие сигнала 50 измеряется мерой 52, может определяться блоком 32 назначения разными способами. Например, блок 32 назначения может контролировать соответствующий параметр основного тона, переносимый в одном или более из кадров 18 на участке 44, предшествующем потерянному участку 20 потока 14 данных. Таким образом, взаимный сдвиг s, при котором можно измерять самоподобие, может соответствовать периоду основного тона, причем основной тон определяется на основании параметра в потоке 14 данных, а именно участку 44. Самоподобие или корреляция 56 при этом сдвиге периода основного тона может использоваться в качестве второй меры 52.

Очевидно, что порядок осуществления определения 40 и 50, соответственно, может меняться на обратный, или что оба обнаружения могут осуществляться одновременно. На основании мер 42 и 52, осуществляется назначение 60. Это назначение 60 выбирает один из двух инструментов 28 PLC для маскирования потери участка 22. Затем этот инструмент PLC, т.е. назначенный инструмент 62 PLC, используется для маскирования потери участка 22.

Если быть кратким, следует отметить, что количество инструментов 28 PLC, между которыми осуществляется выбор путем 60 назначения, может быть больше двух.

В соответствии с вариантом осуществления, дополнительно изложенным ниже, однако, инструмент PLC, обозначенный на фиг. 2 как PLC 1, можно описать как 1, с использованием которой заменяющий сигнал 30, т.е. оценка аудиосигнала на участке 22, получается или восстанавливается с использованием тонального маскирования потерь пакетов во временной области. Другими словами, PLC 1 может быть маскирование потерь пакетов, предназначенным для восстановления аудиосигнала монофонических участков. PLC 1 может восстанавливать аудиосигнал на пропущенном участке 22 аудиосигнала 12 с использованием периодического сигнала, периодичность которого зависит от параметра основного тона или значение основного тона, выведенного из потока данных, а именно из участка 44 потока 14 данных, т.е. участка 44, предшествующего потерянному участку 20 потока 14 данных.

Второй инструмент PLC, PLC 2, может предназначаться для восстановления аудиосигналов полифонического типа. Маскирование этого второго инструмента PLC, PLC 2, может базироваться на тональное маскирование потерь пакетов в частотной области.

Возможная реализация PLC 1 и PLC 2 будет кратко объяснена с обращением к фиг. 5 и 6.

Фиг. 5 иллюстрирует PLC 1. Параметр основного тона или значение 66 основного тона, переносимое в кадре 18 на участке 44, предшествующем потерянному участку 20 потока 14 данных, используется для задания периодичности или длины 68 периода периодического сигнала 70, которая затем используется для формирования заменителя или используется для маскирования потери на участке 22 аудиосигнала 12. Параметр основного тона или значение 66 основного тона может присутствовать в потоке 14 данных для использования аудиодекодером 10 в случае нормального аудиодекодированиея, т.е. в отсутствие потери сигнала, для управления, например, инструмента фильтрации гармоник и т.п.Таким образом, параметр 66 может так или иначе присутствовать в потоке 14 данных. В противном случае, инструмент 28 PLC, осуществляющий PLC 1 согласно фиг. 5, может определять период 68 основного тона посредством анализа, например, анализируя декодированный сигнал 50 перед потерянным участком 22 или анализируя самую последнюю доступную версию спектра, например спектр 46 изображенный на фиг. 3.

Фиг. 6 иллюстрирует PLC 2 в соответствии с вариантом осуществления. Здесь, инструмент 28 PLC, отвечающий за осуществление PLC 2, использует, например, один или два или более самых последних полученных спектра, которые получаются из участка 44 потока 14 данных, для обнаружения или определения в нем тональных спектральных компонент, т.е. пиков 72 в спектре 46 или пиков 72 в спектре 46, возникающих в этом положении или в достаточно близком положении в спектре из некоторого количества последовательных спектров или кадров 18, соответственно. Достаточно близкими положениями могут называться те, спектральное расстояние между которыми меньше некоторой пороговой величины. Спектральные положения пиков 72 представляют тональные спектральные компоненты, и здесь, в этих спектральных положениях, обнаружение фазы осуществляется, например, путем использования или оценки, например, спектра мощности аудиосигнала. Затем, на временном участке 22, где требуется замаскировать потерю сигнала, комбинация сигналов, периодичности которых зависят от тональных спектральных компонентов, формируется для получения заменяющего сигнала 30, причем взаимный сдвиг фазы между комбинированными сигналами регулируется в зависимости от обнаружения фазы. Например, определяется фаза каждой тональной компоненты 72 или определяются лишь разности фаз между этими тональными компонентами, и на участке 22 в качестве заменителя 30 формируется сигнал, который синтезируется этими тональными компонентами 72 согласно разностям фаз или фазам. Комбинация может формироваться в спектральной области, где заменяющий сигнал 30 получается путем обратного преобразования, или во временной области, непосредственно путем суммирования, например, сигналов, имеющих надлежащий сдвиг между собой, причем этот сдвиг отражает определяемый взаимный сдвиг фазы.

Как более подробно описано ниже, назначение 60 может осуществляться таким образом, что PLC 1 выбирается или назначается участку 22 с тем большей вероятностью, чем ниже спектральное положение 48 и чем выше временная предсказуемость и, наоборот, PLC 2 назначается или выбирается с тем большей вероятностью, чем выше спектральное положение 48 и чем ниже временная предсказуемость. Более высокое спектральное положение соответствует более высокой частоте, и более низкое спектральное положение - более низкой частоте. Благодаря этому, PLC 1 с большей вероятностью выбирается в случае, когда участок 22 соответствует потерянной речи, и PLC 2 с большей вероятностью выбирается в случае, когда участок 22 связан с полифоническими сигналами или музыкой.

Для полноты, на фиг. 7 отражен тот факт, что процесс назначения, показанный на фиг. 2, можно расширить. В частности, как показано на фиг. 2, назначение 60 производится путем ограничения назначения или выбора 60 назначения поднабором 80 инструментов 28 PLC. Набор 26 инструментов 28 PLC может дополнительно содержать поднабор из одного или более инструментов 28 PLC, например поднабор 82, и, будучи инициирована обнаружением 36 потерь, обнаружение 84 тональности может использоваться блоком 32 назначения в первую очередь для определения, является ли участок 22 тональным участком или нет.Определение тональности 84 дает меру или указатель 86 тональности, и эту/этот меру/указатель 86 тональности можно получать в 84 с использованием одного или более параметров на участке 44 потока 14 данных, например, проверяя, содержит ли самый последний кадр 18 на участке 44 некоторый параметр основного тона, например, значение 66 основного тона, как показано на фиг. 5. В случае отсутствия, это можно интерпретировать как указание того, что аудиосигнал в данный момент является нетональным, и, в случае наличия параметра 66 основного тона, это можно интерпретировать как указание того, что аудиосигнал в данный момент является тональным. Это указание является мерой 86 тональности. Использование меры 86 позволяет определить на этапе 88, является ли аудиосигнал тональным или нет, и если он является нетональным, PLC 62, назначенный участку 22, назначается из поднабора 82. Фиг. 7 иллюстрирует случай, когда в поднаборе 82 содержится один инструмент 28 PLC, который и выбирается. Однако, даже в этом случае, может следовать дополнительный выбор из поднабора 82. В случае подтверждения тональности на этапе 88, назначение 60 на основании определений 40 и 50 осуществляется в отношении поднабора 80, как описано выше с обращением к фиг. 2.

PLC 3 может быть нетональным PLC, например PLC, который восстанавливает аудиосигнал для участка 22 путем использования повторения кадра с дублирующей модификацией или без нее, когда дублирующая модификация может, как указано выше, предусматривать знаковое скремблирование, т.е. случайную смену знака спектральных коэффициентов самого последнего принятого спектра, например спектра 46, который затем подвергается обратному преобразованию и используется для вывода заменяющего сигнала 30.

Фиг. 8 демонстрирует дерево решений для выбора из инструментов 28 PLC способом, представленным, например, на фиг. 7. Решения A и B принимаются для определения, какой из трех способов PLC, PLC 1 - PLC 3, предназначенных для разных типов сигнала, подлежат использованию для некоторого пропущенного участка 22 сигнала для получения наилучшей характеристики маскирования. Первое решение, решение A, базируется на тональности. Если сигнал оказывается нетональным, для маскирования используется PLC 3. Если тональным, принимается решение B. Решение B проверяет характеристики тонального сигнала на основании мер 42 и 52 способом, описанным выше с обращением к фиг. 2 и 7 и, в зависимости от характеристик, выбирает один из PLC 1 и PLC 2. Как объяснено выше, PLC 1 может быть тональным PLC во временной области для монофонических и/или речевых сигналов, тогда как PLC 2 может быть тональным PLC в частотной области для полифонических и/или музыкальных сигналов.

Таким образом, дерево решений на фиг. 8, демонстрирует решения, которые могут приниматься в отношении трех способов PLC для разных типов сигнала для получения наилучшей характеристики маскирования. Решение A, которое может соответствовать проверке 88 на фиг. 7, может осуществляться путем проверки классификации типов сигнала, т.е. путем использования ее как указания или путем вывода из нее указателя тональности. Классификация типов сигнала, возможно, присутствует в каждом кадре 18 и указывает класс кадра для каждого кадра. Он может вычисляться на стороне кодера и передаваться в битовом потоке 14 на аудиодекодер. Альтернативно, он может вычисляться на стороне декодера. Однако вычисление класса кадра является очень сложным и может требовать вычисления всех признаков в каждом кадре вследствие зависимости класса кадра от кадра. Поэтому, для несложных применений следует отдавать предпочтение более простому подходу. Как указано выше, в качестве указателя 86 можно использовать наличие или отсутствие некоторого параметра 66 основного тона.

Решение B, которое соответствует назначению 60 на основании определений 40 и 52, дает хороший выбор между PLC#1 и PLC#2. В [6] такой выбор производился на основании измерения стабильности спектральной огибающей, которая коррелирует с кратковременной стационарностью сигнала. Однако, чем стационарнее сигнал, тем лучше характеристика обоих способов тонального PLC PLC#1 и PLC#2. Это означает, что стационарность не является адекватным критерием для выбора оптимального способа тонального маскирования. Признак стационарности очень хорошо указывает тональность, однако он не позволяет отличить речь/монофонический сигнал от музыки/полифонического сигнала.

Как рассмотрено выше, дерево решений на фиг. 8 можно осуществлять с использованием классификатора PLC, представленного блоком 32 назначения, который может действовать на покадровой основе без каких-либо межкадровых зависимостей и, таким образом, требует лишь низкой сложности. Он может вычислять свои классификационные признаки 42 и 52 только в случае потери кадра, которая обнаруживается или проверяется на этапе 38, и поэтому не добавляет имманентной компенсации сложности в безошибочных кадрах среди кадров 18.

Решение A может осуществляться на основании указателя 86 тональности, которым может быть наличие значения основного тона в последнем хорошем принятом аудиокадре. Решение B может осуществляться путем использования спектрального центроида 48 и выигрыша 56 за счет долгосрочного предсказания, вычисленного на последнем хорошем принятом аудиокадре.

Решение B может приниматься либо в пользу способа маскирования PLC#1 во временной области на основе основного тона, наиболее пригодного для монофонических и речеподобных сигналов, либо в пользу способа PLC#2 в частотной области, наиболее пригодного для полифонических или сложных музыкальных сигналов. Преимущество классификации решения B объясняется тем, что:

- спектральный центроид спектрально располагается очень низко для речевых сигналов и более высоко для музыкальных сигналов;

- выигрыш за счет долгосрочного предсказания высок для монофонических и стационарных сигналов, например речевых сигналов и низок для полифонических или менее стационарных сигналов, например тональных или сложных музыкальных сигналов.

Таким образом, взвешенная комбинация обоих признаков 42 и 52 может использоваться для решения B и процесса 60 назначения и позволяет надежно различать речевые/монофонические и полифонические/сложные музыкальные сигналы. В то же время, сложность может оставаться низкой.

Если аудиодекодер принимает поврежденный кадр или если кадр потерян, т.е. встречается потерянный участок 20, что обнаруживается на этапе 38, может осуществляться следующее, также обращаясь к фиг. 2:

a. На этапе 88 принимается решение A, использовать ли способ тонального маскирования наподобие PLC#2 или PLC#1 для маскирования потерянного/поврежденного кадра, представляющего участок 20, или маскирования потери соответствующего участка 22. Это решение A базируется на указателе 68 тональности, для которого можно использовать наличие значения 66 основного тона в последнем хорошем кадре в битовом потоке.

b. В случае отрицательного решения A, никакого тонального PLC не используется. Напротив, в этом случае используется другой способ PLC, т.е. PLC#3. Может использоваться повторение кадра со знаковым скремблированием.

c. В случае положительного решения A, для маскирования потерянного/поврежденного кадра используется один из двух способов тонального PLC PLC#1 и PLC#2. Два способа PLC могут представлять собой либо PLC на основе основного тона во временной области, например TCX TD-PLC, упомянутый в [4], либо тональное маскирование в частотной области, например тональное маскирование MDCT, упомянутое в [4], причем соответствующее описание включено в настоящую заявку путем ссылки.

В случае положительного решения A, признаки 42 и 52 можно вычислять на основании последнего хорошего кадра следующим образом:

- в качестве признака или меры 52, выигрыш за счет долгосрочного предсказания :

можно вычислять на этапе 50, где - значение основного тона последнего хорошего кадра, и - последние декодированные временные выборки последнего хорошего кадра, и

где может представлять собой ограниченное значение, например, максимальное значение основного тона или длина кадра (например, 10 мс).

- в качестве признака или меры 42, спектральный центроид :

можно вычислять на этапе 40, где - длина последнего принятого спектра , и означает амплитудный спектр.

Два вычисленных признака объединяются согласно следующей формуле:

где , и - весовые коэффициенты. В одном варианте осуществления, , и . Альтернативно , и задаются таким образом, что , , и . Весовые коэффициенты можно нормализовать здесь к диапазону [-1:1]

Затем PLC#1, например, способ PLC на основе основного тона во временной области, можно выбирать, если на этапе 60, и, в противном случае, PLC#2, например, тональное маскирование в частотной области.

В связи с вышеприведенным описанием следует сделать несколько замечаний. Например, спектр, спектральный центроид которого измеряется для получения первой меры 42, может быть так называемой взвешенной версией, например, версией с предыскажением. Такое взвешивание используется, например, для адаптации шума квантования к психоакустическому порогу маскирования. Другими словами, возможно, что первая мера 42, измеряющая спектральное положение 48 спектрального центроида психоакустического масштабированного спектра аудиосигнала. Это может иметь особые преимущества в случаях, когда нормальное аудиодекодирование кодированного базового ядра 24 аудиодекодирования предусматривает, что в поток 14 данных так или иначе закодирован аудиосигнал 12 в спектральной области, а именно во взвешенной области. Дополнительно или альтернативно, спектр, спектральный центроид которого измеряется для получения первой меры 42, не обязательно представлять со столь же высоким спектральным разрешением, как спектральное разрешение, используемое в ядре 24 аудиодекодирования для перехода во временную область. Напротив, оно может быть более высоким или более низким. Дополнительно или альтернативно, следует отметить, что спектр аудиосигнала также выражается в масштабных коэффициентах. Такие масштабные коэффициенты могут передаваться в потоке 14 данных совместно со спектральными коэффициентами для совместного формирования кодированного представления спектра аудиосигнала. Для некоторого участка 22 спектральные коэффициенты масштабируются согласно масштабным коэффициентам. Спектральных коэффициентов больше, чем масштабных коэффициентов. Например, каждый масштабный коэффициент, назначается одной из нескольких спектральных полос, так называемых полос масштабных коэффициентов, на которые делится полоса аудиосигнала. Таким образом, масштабные коэффициенты задают спектр аудиосигнала для некоторого участка в отношении огибающей с несколько более низким спектральным разрешением по сравнению со спектральным разрешением, с которым квантованные спектральные коэффициенты кодируются в потоке 14 данных. Возможно даже, что спектральное разрешение, с которым масштабные коэффициенты кодируются в потоке 14 данных, еще ниже, чем спектральное разрешение с которым ядро 24 декодирования осуществляет деквантование спектральных коэффициентов. Например, ядро 24 декодирования может подвергать масштабные коэффициенты, закодированные в поток 14 данных, спектральной интерполяции для получения интерполированных масштабных коэффициентов с более высоким спектральным разрешением, чем закодированные в поток данных, и использовать интерполированные масштабные коэффициенты для деквантования. Любой из масштабных коэффициентов, закодированных в поток данных, и интерполированных масштабных коэффициентов можно использовать как спектр аудиосигнала, спектральный центроид которого измеряется первой мерой 42. Это означает, что измерение центроида становится весьма вычислительно эффективным в том смысле, что количество вычислительных операций, необходимых для определения первой меры, меньше, чем при измерении центроида с любым более высоким разрешением, например, применяемым при кодировании спектрального коэффициента, или какого-либо другого разрешения в случае получения спектра для измерения центроида, при котором декодированный аудиосигнал подвергается дополнительному спектральному разложению, что еще больше увеличивает затраты вычислительной мощности. Таким образом, в качестве конкретного примера, первую и вторую меры можно вычислять следующим образом на основании кодированных дискретизированных с понижением масштабных коэффициентов SNS (спектральное формирование шума):

сначала, значение основного тона можно вычислять в качестве основы:

где и - параметры битового потока, выведенные декодером из последнего хорошего кадра. можно интерпретировать как указатель тональности.

В качестве второй меры, выигрыш за счет долгосрочного предсказания можно вычислить по формуле:

где - последние декодированные временные выборки, и может быть заданным значением длины, например, ограниченным значением, например, максимальным значением основного тона или длина кадра (например, 10 мс), например

где - минимальное значение основного тона. Таким образом, вторая мера будет вычисляться как самоподобие декодированного аудиосигнала во временной области на самом последенем принятом участке со своей копией, сдвинутой на период основного тона.

В качестве второй меры, спектральный центроид можно вычислять по формуле:

где - частота дискретизации и

и - индексы неоднородной полосы, т.е. индексы полосы, задающие для каждой полосы нижнюю и верхнюю частотные границы таким образом, что значения ширины полосы, заданные разностью между соответствующими нижней и верхней границами, отличаются друг от друга, например, увеличиваются с увеличением частоты, хотя разность не обязательна. Индексы полосы могут задаваться в зависимости частоты дискретизации/частоты аудиосигнала. Кроме того,

где - вектор масштабных коэффициентов, хранящийся в битовом потоке последнего хорошего кадра, и - заданный коэффициент наклона, который может быть установлен по умолчанию и, возможно, в зависимости от частоты дискретизации аудиосигнала. Член применяется для преобразования масштабных коэффициентов, кодированных в логарифмической области, обратно в линейную область. Член применяется для создания фильтра, обратного фильтру предыскажений на стороне кодера, который именуется фильтром компенсации предыскажений.

Вектор масштабных коэффициентов вычисляется на стороне кодера и передается в битовом потоке. Он определяется энергиями полос коэффициентов MDCT, где полосы не однородны и следуют перцептивно-релевантной лающей шкале (меньше на низких частотах, больше на высоких частотах). После сглаживания, создания предыскажений и преобразования энергий в логарифмическую область, они, на стороне кодера, дискретизируются с понижением от 64 параметров к 16 параметрам для формирования вектора масштабных коэффициентов, который затем кодируется и передается в битовом потоке. Таким образом, - это мера для спектрального положения 48 спектрального центроида спектра 46 аудиосигнала, определяемая здесь на основании его спектрально-грубо дискретизированной версии, а именно параметров SNS.

Затем решение или выбор среди различных способов PLC может осуществляться согласно критериям и . Повторение кадра со знаковым скремблированием может быть выбрано, если (это означает, что указатель тональности ). В противном случае, значение вычисляется следующим образом:

Если , может быть выбран способ PLC на основе основного тона во временной области; в противном случае - тональное маскирование в частотной области.

Таким образом, аудиодекодер для декодирования аудиосигнала 12 из потока 14 данных, который содержит набор 26 разных инструментов 28 маскирования потерь, может быть выполнен с возможностью определения 40 первой меры 42, измеряющей спектральное положение 48 спектрального центроида спектра 46 аудиосигнала путем вывода спектра из масштабных коэффициентов в самом последнем не подверженном потере участие потока данных, определения 50 второй меры 52, измеряющей временную предсказуемость аудиосигнала, назначения 32 одного, 62, из набора 26 разных инструментов 28 маскирования потерь участку 22 аудиосигнала 12, подверженному потере, на основании первой и второй мер, и восстановления участка 22 аудиосигнала с использованием одного инструмента 62 маскирования потерь, назначенного участку 22. Вывод спектра может предусматривать, как описано, спектральную интерполяцию масштабных коэффициентов, закодированных в поток данных. В качестве дополнения или альтернативы, они могут подвергаться фильтрации для компенсации предыскажений, т.е. они могут умножаться на передаточную функцию фильтра компенсации предыскажений. Затем полученные масштабные коэффициенты могут подвергаться измерению спектрального центроида. Затем также могут применяться все остальные вышеописанные детали. Таким образом, в порядке неограничительных примеров: набор 26 разных инструментов маскирования потерь может содержать первый инструмент маскирования потерь для восстановления аудиосигнала монофонических участков, и второй инструмент маскирования потерь для восстановления аудиосигнала полифонических участков, и аудиодекодер может быть выполнен с возможностью, при назначении одного из набора разных инструментов маскирования потерь участку аудиосигнала на основании первой и второй мер, назначения участку первого инструмента маскирования потерь с тем большей вероятностью, чем ниже спектральное положение спектрального центроида и чем выше временная предсказуемость, и назначения участку второго инструмента маскирования потерь с тем большей вероятностью, чем выше спектральное положение спектрального центроида и чем ниже временная предсказуемость. В качестве дополнения или альтернативы, аудиодекодер может быть выполнен с возможностью, при назначении одного из набора разных инструментов маскирования потерь участку 22 аудиосигнала, подверженному потере, на основании первой и второй мер, осуществления суммирования по первой и второй мерам 42, 52 для получения скалярного значения суммы и сравнения скалярного значения суммы с пороговой величиной.

Хотя некоторые аспекты были описаны в контексте устройства, очевидно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа также представляют описание соответствующего блока или элемента или признака соответствующего устройства. Некоторые или все из этапов способа может выполняться посредством (или с использованием) аппаратного устройства, например, микропроцессора, программируемого компьютера или электронной схемы. В некоторых вариантах осуществления, один или более из наиболее важных этапов способа могут выполняться таким устройством.

В зависимости от некоторых требований к реализации, варианты осуществления изобретения можно реализовать аппаратными средствами или программными средствами. Реализация может осуществляться с использованием цифрового носителя данных, например, гибкого диска, DVD, Blu-Ray, CD, ROM, PROM, EPROM, EEPROM или флеш-памяти, где хранятся считываемые электронными средствами сигналы управления, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой, благодаря чему осуществляется соответствующий способ. Таким образом, цифровой носитель данных может быть машиночитаемым.

Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий считываемые электронными средствами сигналы управления, которые способны взаимодействовать с программируемой компьютерной системой, благодаря чему осуществляется один из описанных здесь способов.

В общем случае, варианты осуществления настоящего изобретения можно реализовать как компьютерный программный продукт с программным кодом, причем программный код призван осуществлять один из способов при выполнении компьютерного программного продукта на компьютере. Программный код может, например, храниться на машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для осуществления одного из описанных здесь способов, хранящуюся на машиночитаемом носителе.

Другими словами, вариант осуществления способа согласно изобретению представляет собой, таким образом, компьютерную программу, имеющую программный код для осуществления одного из описанных здесь способов, при выполнении компьютерной программы на компьютере.

Дополнительный вариант осуществления способов согласно изобретению, таким образом, представляет собой носитель данных (или цифровой носитель данных или машиночитаемый носитель), на котором записана компьютерная программа для осуществления одного из описанных здесь способов. Носитель данных, цифровой носитель данных или носитель записи обычно являются физическими и/или постоянными.

Дополнительный вариант осуществления способа согласно изобретению представляет собой, таким образом, поток данных или последовательность сигналов, представляющие компьютерную программу для осуществления одного из описанных здесь способов. Поток данных или последовательность сигналов могут, например, быть выполнены с возможностью переноса через соединение для передачи данных, например через интернет.

Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью или адаптированное для осуществления одного из описанных здесь способов.

Дополнительный вариант осуществления содержит компьютер, на котором установлена компьютерная программа для осуществления одного из описанных здесь способов.

Дополнительный вариант осуществления согласно изобретению содержит устройство или систему, выполненные с возможностью переноса (например, электронного или оптического) компьютерной программы для осуществления одного из описанных здесь способов в приемник. Приемником может быть, например, компьютер, мобильное устройство, запоминающее устройство и т.п. Устройство или система могут, например, содержать файловый сервер для переноса компьютерной программы в приемник.

В некоторых вариантах осуществления, программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может использоваться для осуществления некоторых или всех из функциональных возможностей описанных здесь способов. В некоторых вариантах осуществления, программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для осуществления одного из описанных здесь способов. В общем случае, способы предпочтительно осуществляются любым аппаратным устройством.

Описанное здесь устройство может быть реализовано с использованием аппаратного устройства, или с использованием компьютера, или с использованием сочетания аппаратного устройства и компьютера.

Описанное здесь устройство, или любые компоненты описанного здесь устройства, могут быть реализованы по меньшей мере частично аппаратными средствами и/или программными средствами.

Описанные здесь способы могут осуществляться с использованием аппаратного устройства, или с использованием компьютера, или с использованием комбинации аппаратного устройства и компьютера.

Описанные здесь способы или любые компоненты описанного здесь устройства могут быть реализованы по меньшей мере частично аппаратными средствами и/или программными средствами.

Вышеописанные варианты осуществления лишь иллюстрируют принципы настоящего изобретения. Следует понимать, что специалистам в данной области техники будут очевидны модификации и вариации описанных здесь конфигураций и подробностей. Таким образом, следует ограничиваться только объемом нижеследующей формулы изобретения, а не конкретными подробностями, приведенными в качестве описания и пояснения рассмотренных здесь вариантов осуществления.

[1] 3GPP TS 26.445; Codec for Enhanced Voice Services (EVS); Detailed algorithmic description.

[2] ITU-T G.718: Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s.

[3] ITU-T G.711 Appendix I: A high quality low-complexity algorithm for packet loss concealment with G.711.

[4] 3GPP TS 26.447; Codec for Enhanced Voice Services (EVS); Error concealment of lost packets.

[5] Method and device for efficient frame erasure concealment in speech codecs; WO2007073604 (A1) - 2007-07-05

[6] Selecting a Packet Loss Concealment Procedure; EP3111624 A1-2017-01-04

1. Аудиодекодер для декодирования аудиосигнала (12) из потока (14) данных, причем аудиодекодер содержит набор (26) разных инструментов (28) маскирования потерь и выполнен с возможностью

определения (40) первой меры (42), измеряющей спектральное положение (48) спектрального центроида спектра (46) аудиосигнала,

определения (50) второй меры (52), измеряющей временную предсказуемость аудиосигнала, причём вторая мера является мерой самоподобия или автокорреляции или представляет собой выигрыш за счет долгосрочного предсказания;

назначения (32) одного (62) из набора (26) разных инструментов (28) маскирования потерь участку (22) аудиосигнала (12), подверженному потере, на основании первой и второй мер, и

восстановления участка (22) аудиосигнала с использованием одного инструмента (62) маскирования потерь, назначенного участку (22),

причём набор (26) разных инструментов маскирования потерь содержит

первый инструмент (PLC#1) маскирования потерь для восстановления аудиосигнала монофонических участков, и

второй инструмент (PLC#2) маскирования потерь для восстановления аудиосигнала полифонических участков, и

причём аудиодекодер выполнен с возможностью, при назначении одного из набора разных инструментов маскирования потерь участку аудиосигнала на основании первой и второй мер, назначения участку первого инструмента маскирования потерь с тем большей вероятностью, чем ниже спектральное положение спектрального центроида и чем выше временная предсказуемость, и назначения участку второго инструмента маскирования потерь с тем большей вероятностью, чем выше спектральное положение спектрального центроида и чем ниже временная предсказуемость.

2. Аудиодекодер по п. 1, в котором набор (26) разных инструментов (28) маскирования потерь содержит один или более из

первого инструмента (PLC#1) маскирования потерь для восстановления аудиосигнала путем синтеза аудиосигнала с использованием периодического сигнала (70), периодичность (68) которого зависит от значения (66) основного тона, выведенного из потока данных, и

второго инструмента (PLC#2) маскирования потерь для восстановления аудиосигнала путем обнаружения тональных спектральных компонент (72) аудиосигнала, осуществления обнаружения фазы для тональных спектральных компонент (72) и синтеза аудиосигнала путем объединения сигналов, периодичности которых зависят от тональных спектральных компонент (72) с регулировкой взаимного сдвига фазы между сигналами в зависимости от обнаружения фазы, и

третьего инструмента (PLC#3) маскирования потерь для восстановления аудиосигнала путем использования повторения кадра.

3. Аудиодекодер по п. 1, в котором набор (26) разных инструментов маскирования потерь содержит

первый инструмент (PLC#1) маскирования потерь для восстановления аудиосигнала с использованием тонального маскирования потерь пакетов во временной области, и

второй инструмент (PLC#2) маскирования потерь для восстановления аудиосигнала с использованием тонального маскирования потерь пакетов в частотной области.

4. Аудиодекодер по п. 1, в котором набор разных инструментов маскирования потерь содержит

первый инструмент (PLC#1) маскирования потерь для восстановления аудиосигнала путем синтеза аудиосигнала с использованием периодического сигнала, периодичность которого зависит от значения основного тона, выведенного из потока данных, и

второй инструмент (PLC#2) маскирования потерь для восстановления аудиосигнала путем обнаружения тональных спектральных компонент аудиосигнала, осуществления обнаружения фазы для тональных спектральных компонент и синтеза аудиосигнала путем объединения сигналов, периодичности которых зависят от тональных спектральных компонент с регулировкой взаимного сдвига фазы между сигналами в зависимости от обнаружения фазы.

5. Аудиодекодер по п. 4, в котором аудиодекодер выполнен с возможностью

вывода значения (66) основного тона из потока данных путем использования параметра основного тона, переносимого в потоке данных последним, в качестве значения основного тона.

6. Аудиодекодер по п. 1, выполненный с возможностью

осуществления обнаружения (36) потерь для обнаружения участков (22), подверженных потере,

осуществления определения первой и второй мер (42; 52) для участка (22) в ответ на обнаружение потерь, обнаруживающее участок (22), подверженный потере, и неосуществления определения для участков, не подверженных потере.

7. Аудиодекодер по п. 1, дополнительно выполненный с возможностью

определения (84) указателя (86) тональности, указывающего тональность аудиосигнала,

назначения одного из первого и второго поднаборов (80, 82) одного или более инструментов маскирования потерь из набора (26) разных инструментов маскирования потерь, которые взаимно разъединены, участку (22) аудиосигнала на основании указателя (86) тональности, и

осуществления назначения одного из набора разных инструментов маскирования потерь участку аудиосигнала на основании первой и второй мер путем назначения (60) набора разных инструментов маскирования потерь участку аудиосигнала на основании первой и второй мер из первого поднабора (80) одного или более инструментов маскирования потерь, если участку (22) назначен первый поднабор (80) с осуществлением восстановления участка (22) аудиосигнала с использованием одного инструмента (62) маскирования потерь, назначенного участку (22), и осуществления восстановления участка (22) аудиосигнала с использованием одного из второго поднабора (82) инструментов маскирования потерь, если участку назначен второй поднабор (82) инструментов маскирования потерь.

8. Аудиодекодер по п. 7, в котором аудиодекодер выполнен с возможностью

использования параметра, переносимого в потоке данных, в качестве третьей меры.

9. Аудиодекодер по п. 7, в котором аудиодекодер выполнен с возможностью

использования наличия или отсутствия параметра (66) основного тона в самом последнем не подверженном потере кадре потока данных в качестве третьей меры (86).

10. Аудиодекодер по п. 7, в котором набор (26) разных инструментов маскирования потерь содержит

третий инструмент (PLC#3) маскирования потерь для восстановления аудиосигнала путем использования повторения кадра,

причем третий инструмент маскирования потерь включен во второй поднабор (82) и первый и второй инструменты маскирования потерь включены в первый поднабор (80).

11. Аудиодекодер по п. 1, выполненный с возможностью определения (40) первой меры (42) как взвешенной суммы значений положения спектральной компоненты, каждое из которых взвешивается с использованием спектра аудиосигнала при соответствующем значении положения спектральной компоненты.

12. Аудиодекодер по п. 1, выполненный с возможностью определения (50) второй меры (52) как меры корреляции, измеряющей самоподобие аудиосигнала.

13. Аудиодекодер по п. 1, выполненный с возможностью определения (50) второй меры (52) путем вывода основного тона из аудиосигнала и определения второй меры как меры корреляции, измеряющей автокорреляцию аудиосигнала с временным сдвигом (s), который зависит от основного тона.

14. Аудиодекодер по п. 1, выполненный с возможностью определения (40) первой меры (42) путем вывода спектра из масштабных коэффициентов в самом последнем не подверженном потере участке потока данных.

15. Аудиодекодер по п. 1, выполненный с возможностью определения (40) первой меры (42) путем вывода спектра из масштабных коэффициентов в самом последнем не подверженном потере участке потока данных и спектральной интерполяции масштабных коэффициентов, кодированных в поток данных.

16. Аудиодекодер по п. 14, выполненный с возможностью подвергания масштабных коэффициентов фильтрации для компенсации предыскажений путем умножения на передаточную функцию фильтра компенсации предыскажений.

17. Аудиодекодер для декодирования аудиосигнала (12) из потока (14) данных, причем аудиодекодер содержит набор (26) разных инструментов (28) маскирования потерь и выполнен с возможностью

причём набор разных инструментов маскирования потерь содержит

причём аудиодекодер выполнен с возможностью

осуществления обнаружения тональных спектральных компонент (72) путем идентификации совмещенных пиков в одном или более последовательных спектрах (46), выведенных из самого последнего не подверженного потерям участка потока данных.

18. Аудиодекодер по п. 17, в котором в потоке (14) данных кодирован самый последний не подверженный потерям участок потока данных в спектральной области.

19. Аудиодекодер для декодирования аудиосигнала (12) из потока (14) данных, причем аудиодекодер содержит набор (26) разных инструментов (28) маскирования потерь и выполнен с возможностью

причём аудиодекодер выполнен с возможностью, при назначении одного из набора разных инструментов маскирования потерь участку (22) аудиосигнала, подверженному потере, на основании первой и второй мер, осуществления суммирования по первой и второй мерам (42, 52) для получения скалярного значения суммы и сравнения скалярного значения суммы с пороговой величиной.

20. Способ осуществления маскирования потерь при аудиодекодировании аудиосигнала (12) из потока (14) данных, причем способ выполнен с возможностью

причём набор (26) разных инструментов маскирования потерь содержит

первый инструмент (PLC#1) маскирования потерь для восстановления аудиосигнала монофонических участков, и

второй инструмент (PLC#2) маскирования потерь для восстановления аудиосигнала полифонических участков, и

причём назначение одного из набора разных инструментов маскирования потерь участку аудиосигнала на основании первой и второй мер содержит назначение участку первого инструмента маскирования потерь с тем большей вероятностью, чем ниже спектральное положение спектрального центроида и чем выше временная предсказуемость, и назначение участку второго инструмента маскирования потерь с тем большей вероятностью, чем выше спектральное положение спектрального центроида и чем ниже временная предсказуемость.

21. Способ осуществления маскирования потерь при аудиодекодировании аудиосигнала (12) из потока (14) данных, причем способ выполнен с возможностью

причём назначение одного из набора разных инструментов маскирования потерь участку (22) аудиосигнала, подверженному потере, на основании первой и второй мер содержит осуществление суммирования по первой и второй мерам (42, 52) для получения скалярного значения суммы и сравнения скалярного значения суммы с пороговой величиной.

22. Способ осуществления маскирования потерь при аудиодекодировании аудиосигнала (12) из потока (14) данных, причем способ выполнен с возможностью

причём набор разных инструментов маскирования потерь содержит

причём обнаружение тональных спектральных компонент (72) содержит идентификацию пиков в одном или более последовательных спектрах (46), выведенных из самого последнего не подверженного потерям участка потока данных.

23. Машиночитаемый носитель, на котором сохранена компьютерная программа с программным кодом для осуществления, при её выполнении в процессоре, способа по любому из пп. 20-22.

Изобретение относится к области обнаружения объектов в воздушном пространстве, а более конкретно к мультисенсорным способам обнаружения беспилотных летательных аппаратов (БЛА) посредством измерения акустической скорости частиц совместно с радиолокационными измерениями, и может быть использовано в системах безопасности для предотвращения несанкционированного доступа БЛА в контролируемую зону.

Активируемое голосом преобразование звука для головных гарнитур с использованием представления сигналов микрофона в частотной области // 2756385

Заявленная группа изобретений относится к активируемому голосом преобразованию звука для головных гарнитур с применением представления сигналов микрофона в частотной области, что может быть особенно подходящим для применений, относящихся к защите органов слуха. Способ активируемого голосом преобразования включает определение параметра мощности голоса на основании представления в частотной области голосового сигнала, поступающего от голосового микрофона.

Цифровой детектор микронаушников // 2756097

Изобретение относится к области радиотехники, а именно к приемникам, и может быть использовано для обнаружения микронаушников. Техническим результатом является увеличение дальности приема на максимально возможную длину распространения магнитных волн, а также избирательность обнаружения.

Передискретизация звукового сигнала для кодирования/декодирования с малой задержкой // 2756042

Изобретение относится к области вычислительной техники для обработки аудиосигналов. Технический результат заключается в повышении качества обработки сигнала звуковой частоты.

Способ синтеза речи с передачей достоверного интонирования клонируемого образца // 2754920

Изобретение относится к способам синтезирования речи с использованием искусственных нейронных сетей и может быть применено для синтеза речи выбранного спикера с передачей достоверного интонирования клонируемого образца. Технический результат изобретения состоит в том, что достигается передача достоверного интонирования клонируемого образца речи выбранного спикера на естественном языке.

Захват аудио с использованием формирования диаграммы направленности // 2751760

Изобретение относится к акустике. Устройство захвата звука содержит формирователь диаграммы направленности, который выполнен с возможностью генерировать выходной аудиосигнал со сформированной диаграммой направленности.

Компьютерное устройство коммуникации с пользователем // 2746468

Изобретение относится к компьютерным устройствам коммуникации с пользователем. Технический результат заключается в обеспечении возможности в ответ на голосовые запросы пользователя передавать ему объемную визуальную информацию из внешних источников, при этом адаптировать ее для вывода на объёмный дисплей.

Оборудование и способ определения информации основного тона // 2745717

Изобретение относится к обработке аудиосигналов и может быть использовано для получения информации основного тона из аудиосигнала. Оборудование для определения информации основного тона на основе аудиосигнала выполнено с возможностью получать значение подобия, связанное с данной парой частей аудиосигнала, имеющего данный сдвиг по времени, при этом оборудование выполнено с возможностью выбирать длину частей сигнала для аудиосигнала, используемого для того, чтобы получать значение подобия для данного сдвига по времени, в зависимости от данного сдвига по времени, и причем оборудование выполнено с возможностью выбирать длину частей сигнала таким образом, что она линейно зависит от данного сдвига по времени, в пределах допуска в ±1 дискретный отсчет.

Выбор задержки основного тона // 2742739

Изобретение относится к области вычислительной техники для кодирования и декодирования информационного сигнала. Технический результат заключается в повышении точности оценок задержки основного тона, которые лучше подходят к комплексным сигналам, с такой же или меньшей сложностью, чем в известном уровне техники.

Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи // 2742199

Изобретение относится к вычислительной технике. Технический результат заключается в уменьшении опережающего и запаздывающего эха.

Система и способ для генерирования ряда сигналов высокочастотных поддиапазонов // 2758466

Изобретение относится к средствам для высокочастотной реконструкции звуковых сигналов. Технический результат заключается в повышении качества высокочастотной составляющей звукового сигнала.