Устройство, способ и компьютерная программа для устранения артефактов амплитудного ограничения

Авторы патента:

ХОЙБЕРГЕР Альберт (DE)

ХИЛЬПЕРТ Йоханнес (DE)

ЭДЛЕР Бернд (DE)

РЕТТЕЛЬБАХ Николаус (DE)

ГЕИЭРСБЕРГЕР Штефан (DE)

G10L25/69 - Анализирование или синтезирование речи; распознавание речи (ввод/вывод звука для компьютеров G06F 3/16; способы или устройства для обработки цифровых данных, специально предназначенных для манипулирования данными на естественном языке G06F 17/20; обучение или общение со слепыми, глухими или немыми G09B 21/00; телефонная связь H04M)

G10L19/032 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2586874:

ФРАУНХОФЕР-ГЕЗЕЛЛЬШАФТ ЦУР ФЕРДЕРУНГ ДЕР АНГЕВАНДТЕН ФОРШУНГ Е.Ф. (DE)

Изобретение относится к технологиям кодирования/декодирования аудиоинформации. Техническим результатом является обеспечение понижения амплитудных ограничений. Предложено устройство кодирования аудиоинформации. Устройство содержит кодер для кодирования временного фрагмента входного аудиосигнала, подлежащего кодированию, для получения соответствующего кодированного фрагмента сигнала. Устройство кодирования аудиоинформации дополнительно содержит декодер для декодирования кодированного фрагмента сигнала для получения повторно декодированного фрагмента сигнала. Устройство обнаружения амплитудного ограничения предусмотрено для анализа повторно декодированного фрагмента сигнала относительно по меньшей мере одного из фактического амплитудного ограничения сигнала или перцепционного амплитудного ограничения сигнала и для генерирования соответствующего предупреждения об амплитудном ограничении. Кодер дополнительно выполнен с возможностью повторного кодирования временного фрагмента аудиосигнала по меньшей мере с одним измененным параметром кодирования, приводящим к пониженной вероятности амплитудного ограничения, в ответ на предупреждение об амплитудном ограничении. 3 н. и 25 з.п. ф-лы, 5 ил.

В современных цепочках производства и передачи аудиосодержимого доступное в цифровой форме основное содержимое (PCM-поток) кодируется, например, посредством профессионального кодера AAC (усовершенствованного кодирования звука) на сайте создания содержимого. Затем получаемый битовый поток AAC поступает в продажу, например, через музыкальный магазин Apple iTunes Music. Оказывается, что в редких случаях некоторые декодированные PCM-выборки «подвергаются амплитудному ограничению», и это означает, что две или более последовательные выборки достигают максимального уровня, который может быть представлен базовой битовой разрешающей способностью (например, 16 битов) равномерно квантованного представления чисел с фиксированной точкой (PCM) для формы волны на выходе. Это может приводить к слышимым артефактам (щелчкам или кратковременным искажениям). Поскольку это происходит на стороне декодера, нет никакого способа решения этой проблемы после того, как содержимое передано. Единственный способ справиться с этой проблемой на стороне декодера может состоять в формировании «подключаемого расширения» для декодеров с функциональной возможностью препятствования амплитудному ограничению. Технически это может означать изменение распределения энергии в поддиапазонах (однако только на прямой моде, то есть не будет итерационного цикла, который учитывает психоакустическую модель…). Если предположить, что аудиосигнал на входе кодера находится ниже порогового уровня амплитудного ограничения, причины амплитудного ограничения в современном перцепционном аудиокодере оказываются многообразными. Прежде всего, аудиокодер применяет квантование к переданному сигналу, который доступен в форме разложения на частотные составляющие волны на входе, чтобы снизить скорость передачи данных. Ошибки квантования в частотной области приводят к небольшой девиации амплитуды и фазы сигнала относительно исходной формы волны. Если амплитудные или фазовые погрешности добавляются конструктивно, результирующая амплитуда во временной области временно может становиться более высокой, чем исходная форма волны. Во-вторых, способы параметрического кодирования (например, репликация спектральной полосы, SBR) параметризуют мощность сигнала довольно грубо. Информация о фазе опускается. Следовательно, сигнал на стороне приемника восстанавливается только с правильной мощностью, но без сохранения формы волны. Сигналы с амплитудой, близкой к полномасштабной, подвержены амплитудному ограничению.

Поскольку в сжатом представлении битового потока динамический диапазон разложения на частотные составляющие намного больше, чем типичный 16-битовый диапазон PCM, битовый поток может переносить более высокие уровни сигналов. Следовательно, фактически амплитудное ограничение возникает, только когда выходной сигнал декодеров преобразуется (и ограничивается) в представление PCM с фиксированной точкой.

Желательно предотвращать возникновение амплитудного ограничения в декодере путем обеспечения кодированного сигнала для декодера, который не применяет амплитудное ограничение, чтобы не было необходимости в реализации предотвращения амплитудного ограничения в декодере. Другими словами, желательно, чтобы декодер мог выполнять стандартное декодирование без необходимости в обработке сигнала относительно предотвращения амплитудного ограничения. В частности, в настоящее время уже используется множество декодеров, и эти декодеры должны быть модернизированы для того, чтобы извлечь выгоду из предотвращения амплитудного ограничения на стороне декодера. Кроме того, как только произошло амплитудное ограничение (то есть кодированный аудиосигнал был кодирован способом, который подвержен возникновению амплитудного ограничения), некоторая часть информации может быть безвозвратно потеряна, так что даже кодеру с поддержкой предотвращения амплитудного ограничения, вероятно, придется прибегнуть к экстраполированию или интерполированию участка ограниченного по амплитуде сигнала на основе предыдущих и/или последующих участков сигнала.

В соответствии с вариантом осуществления, предлагается устройство кодирования аудиоинформации. Устройство кодирования аудиоинформации содержит кодер, декодер и устройство обнаружения амплитудного ограничения. Кодер выполнен с возможностью кодирования временного фрагмента входного аудиосигнала, подлежащего кодированию, для получения соответствующего кодированного фрагмента сигнала. Декодер выполнен с возможностью декодирования кодированного фрагмента сигнала для получения повторно декодированного фрагмента сигнала. Устройство обнаружения амплитудного ограничения выполнено с возможностью проведения анализа повторно декодированного фрагмента сигнала относительно по меньшей мере одного из фактического амплитудного ограничения сигнала или перцепционного (воспринимаемого) амплитудного ограничения сигнала. Устройство обнаружения амплитудного ограничения также выполнено с возможностью формирования соответствующего предупреждения об амплитудном ограничении. Кодер дополнительно выполнен с возможностью повторного кодирования временного фрагмента аудиосигнала по меньшей мере с одним измененным параметром кодирования, приводящим к пониженной вероятности амплитудного ограничения, в ответ на предупреждение об амплитудном ограничении.

В дополнительном варианте осуществления предлагается способ кодирования аудиоинформации. Способ содержит кодирование временного фрагмента входного аудиосигнала, подлежащего кодированию, для получения соответствующего кодированного фрагмента сигнала. Способ дополнительно содержит декодирование кодированного фрагмента сигнала для получения повторно декодированного фрагмента сигнала. Повторно декодированный фрагмент сигнала анализируется относительно по меньшей мере одного из фактического или перцепционного амплитудного ограничения сигнала. В случае, если в анализируемом повторно декодированном фрагменте сигнала обнаруживается фактическое или перцепционное амплитудное ограничение сигнала, формируется соответствующее предупреждение об амплитудном ограничении. В зависимости от предупреждения об амплитудном ограничении кодирование временного фрагмента повторяется по меньшей мере с одним измененным параметром кодирования, приводящим к уменьшенной вероятности амплитудного ограничения.

Дополнительный вариант осуществления предлагает компьютерную программу для реализации вышеупомянутого способа при выполнении на компьютере или процессоре обработки сигналов.

Варианты осуществления настоящего изобретения основаны на понимании того, что каждый кодированный временной фрагмент может быть проверен относительно потенциальных проблем амплитудного ограничения почти сразу посредством повторного декодирования временного фрагмента. Декодирование является значительно менее сложным в вычислительном отношении, чем кодирование. Поэтому непроизводительные затраты на обработку, обусловленные дополнительным декодированием, как правило, являются приемлемыми. Задержка, вводимая дополнительным декодированием, обычно также является приемлемой, например, для приложений передачи мультимедийных потоков (например, интернет-радио): до тех пор, пока повторное кодирование временного фрагмента не является необходимым, то есть до тех пор, пока не обнаруживается потенциальное амплитудное ограничение в повторно декодированном временном фрагменте входного аудиосигнала, задержка составляет приблизительно один временной фрагмент или немного больше, чем один временной фрагмент. В случае, если временной фрагмент должен быть кодирован снова, поскольку во временном фрагменте была идентифицирована потенциальная проблема амплитудного ограничения, задержка увеличивается. Тем не менее, типичная максимальная задержка, которую следует ожидать и принимать во внимание, как правило, все же относительно коротка.

Ниже будут описаны предпочтительные варианты осуществления настоящего изобретения, в которых:

фиг. 1 показывает блок-схему устройства кодирования аудиоинформации в соответствии по меньшей мере с некоторыми вариантами осуществления настоящего изобретения;

фиг. 2 показывает блок-схему устройства кодирования аудиоинформации в соответствии с дополнительными вариантами осуществления настоящего изобретения;

фиг. 3 схематично показывает графическое изображение программы способа кодирования аудиоинформации в соответствии по меньшей мере с некоторыми вариантами осуществления настоящего изобретения;

фиг. 4 схематично иллюстрирует концепцию предотвращения амплитудного ограничения в частотной области путем изменения области частоты, которое вносит наибольшее количество энергии в общий выходной сигнал, посредством декодера; и

фиг. 5 схематично иллюстрирует концепцию предотвращения амплитудного ограничения в частотной области посредством изменения области частоты, которая является с точки зрения восприятия наименее подходящей.

Как указывалось выше, причины для амплитудного ограничения в современном перцепционном аудиокодере весьма разнообразны. Даже когда мы полагаем, что аудиосигнал на входе кодера ниже порогового уровня амплитудного ограничения, тем не менее декодированный сигнал может демонстрировать характеристики амплитудного ограничения. Чтобы уменьшить скорость передачи данных, аудиокодер может применять квантование к передаваемому сигналу, который доступен в форме разложения на частотные составляющие волны на входе. Ошибки квантования в частотной области приводят к небольшим отклонениям амплитуды и фазы декодированного сигнала относительно первоначальной формы волны. Еще один возможный источник различий между исходным сигналом и декодированным сигналом может заключаться в способах параметрического кодирования (например, репликации спектральной полосы, SBR), параметризующих мощность сигнала в довольно грубой форме. Следовательно, декодированный сигнал на стороне приемника восстанавливается только с правильной мощностью, но без сохранения формы волны. Сигналы с амплитудой, близкой к полномасштабной, подвержены амплитудному ограничению.

Новое решение проблемы состоит в том, чтобы объединить кодер и декодер в систему «кодека», которая автоматически регулирует процесс кодирования на основе фрагментов/кадров таким образом, чтобы описанное выше «амплитудное ограничение» исключалось. Эта новая система состоит из кодера, который кодирует битовый поток, и перед тем, как битовый поток выводится, декодер постоянно параллельно декодирует этот битовый поток, чтобы контролировать возникновение какого-либо «амплитудного ограничения». Если такое амплитудное ограничение происходит, декодер инициирует кодер для выполнения повторного кодирования этого фрагмента/кадра (или нескольких последовательных кадров) с различными параметрами так, чтобы амплитудное ограничение больше не происходило.

Фиг. 1 показывает блок-схему устройства 100 кодирования аудиоинформации в соответствии с вариантами осуществления. Фиг. 1 также схематично иллюстрирует сеть 160 и декодер 170 на приемной стороне. Устройство 100 кодирования аудиоинформации выполнено с возможностью приема исходного аудиосигнала, в частности, временного фрагмента входного аудиосигнала. Исходный аудиосигнал может быть обеспечен, например, в формате импульсно-кодовой модуляции (PCM), но также возможны другие представления исходного аудиосигнала. Устройство 100 кодирования аудиоинформации содержит кодер 122 для кодирования временного фрагмента и для получения соответствующего кодированного фрагмента сигнала. Кодирование временного фрагмента, выполняемое кодером 122, может быть основано на алгоритме кодирования аудиоинформации, как правило, с целью сокращения объема данных, требуемых для хранения или передачи аудиосигнала. Временной фрагмент может соответствовать кадру исходного аудиосигнала, «временному интервалу» исходного аудиосигнала, блоку исходного аудиосигнала или другому временному участку исходного аудиосигнала. Два или более фрагментов могут совпадать друг с другом.

Кодированный фрагмент сигнала обычно посылается через сеть 160 в декодер 170 на приемной стороне. Декодер 170 выполнен с возможностью декодирования принятого кодированного фрагмента сигнала и обеспечения соответствующего декодированного фрагмента сигнала, который затем может быть передан на дополнительную обработку, такую как преобразование цифрового кода в звук, усиление, и на устройство вывода (громкоговоритель, головная гарнитура и т.д.).

Выход кодера 122 также соединен с входом декодера 132, в дополнение к сетевому интерфейсу для соединения устройства 100 кодирования аудиоинформации с сетью 160. Декодер 132 выполнен с возможностью декодирования кодированного фрагмента сигнала и формирования соответствующего повторно декодированного фрагмента сигнала. В идеальном случае, повторно декодированный фрагмент сигнала должен быть идентичен временному фрагменту исходного сигнала. Однако, поскольку кодер 122 может быть выполнен с возможностью значительного уменьшения объема данных, а также по другим причинам, повторно декодированный фрагмент сигнала может отличаться от временного фрагмента входного аудиосигнала. В большинстве случаев эти различия едва заметны, но в некоторых случаях различия могут приводить к слышимым помехам в повторно декодированном фрагменте сигнала, в частности, когда аудиосигнал, представленный повторно декодированным фрагментом сигнала, демонстрирует состояние амплитудного ограничения.

Устройство 142 обнаружения амплитудного ограничения соединено с выходом декодера 132. В случае, если устройство 142 обнаружения амплитудного ограничения обнаруживает, что повторно декодированный аудиосигнал содержит одну или более выборок, которые могут быть интерпретированы как амплитудное ограничение, оно выдает предупреждение об амплитудном ограничении через соединение, проведенное в виде пунктирной линии к кодеру 122, которое побуждает кодер 122 снова кодировать временной фрагмент исходного аудиосигнала, но на этот раз по меньшей мере с одним измененным параметром кодирования, таким как уменьшенный общий коэффициент усиления или измененная частотная коррекция, при которой по меньшей мере одна частотная область или полоса ослабляется по сравнению с ранее использованной частотной коррекцией. Кодер 122 выдает второй кодированный фрагмент сигнала, который заменяет предыдущий кодированный фрагмент сигнала. Передача предыдущего кодированного фрагмента сигнала через сеть 160 может быть задержана до тех пор, пока устройство 142 обнаружения амплитудного ограничения при проведении анализа соответствующего повторно декодированного фрагмента сигнала не обнаружит отсутствие потенциального амплитудного ограничения. Таким образом, на приемный конец отправляются только кодированные фрагменты сигнала, которые были проверены относительно возникновения потенциального амплитудного ограничения.

В некоторых случаях декодер 132 или устройство 142 обнаружения амплитудного ограничения может оценивать слышимость такого амплитудного ограничения. В случае, если результат воздействия амплитудного ограничения ниже определенного порогового уровня слышимости, декодер продолжит работу без изменения. Возможны следующие способы изменения параметров:

- Простой способ: слегка уменьшить коэффициент усиления этого фрагмента/кадра (или нескольких последовательных кадров) на этапе ввода данных кодера на постоянный частотно-независимый множитель, который исключает амплитудное ограничение на выходе декодера. Усиление может быть адаптировано в каждом кадре в соответствии со свойствами сигналов. В случае необходимости, могут быть выполнены одна или более итераций с уменьшающимися коэффициентами усиления, так как не может быть определено, что снижение уровня на входе кодера всегда приводит к снижению уровня на выходе декодера: в зависимости от определенной ситуации, кодер может выбирать различные этапы квантования, которые могут оказывать неблагоприятное воздействие в отношении амплитудного ограничения.

- Усовершенствованный способ #1: выполнить повторное квантование в частотной области в тех диапазонах частот, которые обеспечивают наибольшую часть энергии в общем сигнале, или на частотах, которые являются с точки зрения восприятия наименее подходящими. Если амплитудное ограничение вызвано ошибками квантования, подходящими являются два способа:

a) изменить способ округления в устройстве квантования таким образом, чтобы выбрать меньший пороговый уровень квантования для частотного коэффициента, вносящего самый высокий вклад мощности в полосе частот, которая, как предполагается, больше всего способствует проблеме амплитудного ограничения,

b) повысить точность квантования в определенном частотном диапазоне, чтобы уменьшить количество ошибок квантования,

c) повторять этапы a) и b) до тех пор, пока в кодере не определится отсутствие состояния амплитудного ограничения.

- Усовершенствованный способ #2 (этот способ подобен снижению коэффициента амплитуды в системах, основанных на OFDM (мультиплексировании с ортогональным частотным разделением):

a) ввести небольшие (неслышимые) изменения в амплитуду и фазу всех поддиапазонов/или в их подмножество, чтобы уменьшить пиковую амплитуду,

b) оценить слышимость внесенного изменения,

c) проверить снижение пиковой амплитуды во временной области,

d) повторять этапы a)-c) до тех пор, пока пиковая амплитуда временного сигнала не окажется ниже требуемого порогового уровня.

В соответствии с аспектом предлагаемого устройства кодирования аудиоинформации, предлагается «автоматическое» решение проблемы, при котором для предотвращения описанной выше ошибки взаимодействие с человеком больше не требуется. Вместо того, чтобы уменьшать общую громкость полного сигнала, громкость уменьшается только для коротких фрагментов сигнала, что ограничивает изменение в общей громкости полного сигнала.

Фиг. 2 показывает блок-схему устройства 200 кодирования аудиоинформации в соответствии с дополнительными возможными вариантами осуществления. Устройство 200 кодирования аудиоинформации подобно устройству 100 кодирования аудиоинформации, схематично иллюстрируемому на фиг. 1. В дополнение к компонентам, иллюстрируемым на фиг. 1, устройство 200 кодирования аудиоинформации на фиг. 2 содержит сегментатор 112, буфер 152 фрагментов аудиосигнала и буфер 154 кодированных фрагментов. Сегментатор 142 выполнен с возможностью разделения поступающего исходного аудиосигнала на временные фрагменты. Отдельные временные фрагменты подаются в кодер 122, а также в буфер 152 фрагментов аудиосигнала, который выполнен с возможностью временного хранения временного фрагмента (временных фрагментов), в настоящий момент обрабатываемого (обрабатываемых) кодером 122. Между выходом сегментатора 142 и входами кодера 122 и буфера 152 аудиосигнала подключен селектор 116, выполненный с возможностью выбора либо временного фрагмента, представленного сегментатором 142, либо сохраненного, предыдущего временного фрагмента, обеспеченного буфером фрагментов аудиосигнала на входе кодера 122. Селектор 116 управляется посредством управляющего сигнала, выдаваемого устройством 142 обнаружения амплитудного ограничения, таким образом, чтобы в случае, если повторно декодированный фрагмент сигнала демонстрирует потенциальное состояние амплитудного ограничения, селектор 116 выбирал выходной сигнал буфера 142 фрагментов аудиосигнала, чтобы предыдущий временной фрагмент был кодирован снова с использованием по меньшей мере одного измененного параметра кодирования.

Выход кодера 122 соединен с входом декодера 132 (так же, как и для устройства 100 кодирования аудиоинформации, схематично показанного на фиг. 1), а также с входом буфера 154 кодированных фрагментов. Буфер 154 кодированных фрагментов выполнен с возможностью временного хранения кодированного фрагмента сигнала до его декодирования, выполняемого декодером 132, и проведения анализа амплитудного ограничения, выполняемого устройством 142 обнаружения амплитудного ограничения. Устройство 200 кодирования аудиоинформации дополнительно содержит выключатель 156, или элемент разъединения, соединенный с выходом буфера 154 кодированных фрагментов и сетевым интерфейсом устройства 200 кодирования аудиоинформации. Выключатель 156 управляется дополнительным управляющим сигналом, выдаваемым устройством 142 обнаружения амплитудного ограничения. Дополнительный управляющий сигнал может быть идентичен управляющему сигналу для управления селектором 116, или дополнительный управляющий сигнал может быть получен из упомянутого управляющего сигнала, или управляющий сигнал может быть получен из дополнительного управляющего сигнала.

Другими словами, устройство 200 кодирования аудиоинформации на фиг. 2 может содержать сегментатор 112 для того, чтобы разделять входной аудиосигнал для получения по меньшей мере временного фрагмента. Устройство кодирования аудиоинформации дополнительно может содержать буфер 152 фрагментов аудиосигнала для буферизации временного фрагмента входного аудиосигнала в виде буферизованного фрагмента, в то время как временной фрагмент кодируется кодером и соответствующий кодированный фрагмент сигнала вновь декодируется декодером. Предупреждение об амплитудном ограничении при определенных условиях может вызвать подачу буферизованного фрагмента входного аудиосигнала снова в кодер для кодирования по меньшей мере с одним измененным параметром кодирования. Устройство кодирования аудиоинформации дополнительно может содержать входной селектор для кодера, который выполнен с возможностью приема управляющего сигнала от устройства 142 обнаружения амплитудного ограничения и выбора одного из временного фрагмента и буферизованного фрагмента в зависимости от управляющего сигнала. Соответствующим образом, селектор 116 также может быть частью кодера 122, в соответствии с некоторыми вариантами осуществления. Устройство кодирования аудиоинформации дополнительно может содержать буфер 154 кодированных фрагментов для буферизации кодированного фрагмента сигнала, в то время как он вновь декодируется декодером 132 прежде, чем он будет выведен устройством кодирования аудиоинформации, чтобы он мог быть заменен потенциальным последующим кодированным фрагментом сигнала, который был кодирован с использованием по меньшей мере одного измененного параметра кодирования.

Фиг. 3 схематично показывает графическое изображение программы способа кодирования аудиоинформации, содержащее этап 31 кодирования временного фрагмента входного аудиосигнала, подлежащего кодированию. В результате этапа 31 получается соответствующий кодированный фрагмент сигнала. Опять же, на этапе 32 способа на передающей стороне кодированный фрагмент сигнала декодируется снова для получения повторно декодированного фрагмента сигнала. Повторно декодированный фрагмент сигнала анализируется относительно по меньшей мере одного из фактического или перцепционного амплитудного ограничения сигнала, как схематично обозначено на этапе 34. Способ также содержит этап 36, в ходе которого формируется соответствующее предупреждение об амплитудном ограничении в случае, если на этапе 34 было обнаружено, что повторно декодированный фрагмент сигнала содержит одну или более потенциально подвергнутых амплитудному ограничению выборок аудиоинформации. В зависимости от предупреждения об амплитудном ограничении, на этапе 38 способа кодирование временного фрагмента входного аудиосигнала повторяется по меньшей мере с одним измененным параметром кодирования, чтобы снизить вероятность амплитудного ограничения.

Способ дополнительно может содержать разделение входного аудиосигнала для получения по меньшей мере временного фрагмента входного аудиосигнала. Способ дополнительно может содержать буферизацию временного фрагмента входного аудиосигнала в виде буферизованного фрагмента, в то время как временной фрагмент кодируется и соответствующий кодированный фрагмент сигнала повторно декодируется. Затем буферизованный фрагмент при определенных условиях может быть кодирован по меньшей мере с одним измененным параметром кодирования в случае, если обнаружение амплитудного ограничения показало, что вероятность амплитудного ограничения выше определенного порогового уровня.

Способ дополнительно может содержать буферизацию кодированного фрагмента сигнала, в то время как он повторно декодируется и до его вывода так, чтобы он мог быть заменен потенциальным последующим кодированным фрагментом сигнала, полученным повторным кодированием временного фрагмента с использованием по меньшей мере одного измененного параметра кодирования. Действие повторения кодирования может содержать применение кодером общего коэффициента усиления к временному фрагменту, при этом общий коэффициент усиления определяется на основании измененного параметра кодирования.

Действие повторения кодирования может содержать выполнение повторного квантования в частотной области по меньшей мере в одной выбранной области частот. По меньшей мере одна выбранная область частот может вносить наибольшее количество энергии в общий сигнал или являться с точки зрения восприятия наименее подходящей. В соответствии с дополнительными вариантами осуществления способа кодирования аудиоинформации, по меньшей мере один измененный параметр кодирования вызывает изменение способа округления в действии квантования кодирования. Способ округления может быть изменен для области частот, вносящей самый большой энергетический вклад.

Способ округления может быть изменен посредством по меньшей мере одного из выбора меньшего порогового уровня квантования и увеличения точности квантования. Способ дополнительно может содержать введение небольших изменений по меньшей мере в один из параметров амплитуды и фазы по меньшей мере для одной области частот, чтобы уменьшить пиковую амплитуду. В качестве альтернативы, или в дополнение, может быть оценена слышимость внесенного изменения. Способ дополнительно может содержать определение пиковой амплитуды относительно выходного сигнала декодера для проверки уменьшения пиковой амплитуды во временной области. Способ дополнительно может содержать повторение внесения небольшого изменения по меньшей мере в один из параметров амплитуды и фазы и проверки снижения пиковой амплитуды во временной области до тех пор, пока пиковая амплитуда не станет ниже требуемого порогового уровня.

Фиг. 4 схематично иллюстрирует представление частотной области фрагмента сигнала и результат воздействия по меньшей мере одного измененного параметра кодирования в соответствии с некоторыми вариантами осуществления. Фрагмент сигнала представлен в частотной области пятью полосами частот. Следует отметить, что это является только иллюстративным примером, так что фактическое количество полос частот может отличаться. Кроме того, отдельные полосы частот не должны быть равными по ширине полосы, а могут иметь, например, увеличивающуюся ширину полосы с увеличивающейся частотой. В примере, схематично иллюстрируемом на фиг. 4, частотный диапазон или полоса частот между частотами f₂ и f₃ представляет собой полосу частот с самой высокой амплитудой и/или мощностью в рассматриваемом фрагменте сигнала. Мы предполагаем, что устройством 142 обнаружения амплитудного ограничения было установлено, что существует вероятность амплитудного ограничения, если кодированный фрагмент сигнала будет передаваться в том виде, в котором он есть, на приемную сторону и декодироваться там посредством декодера 170. Поэтому, в соответствии с одной стратегией, область частот с самой высокой амплитудой/мощностью сигнала уменьшается на определенную величину, как показано на фиг. 4 заштрихованной областью и стрелкой, указывающей вниз. Хотя это изменение фрагмента сигнала может немного изменить возможный выходной аудиосигнал по сравнению с исходным аудиосигналом, это может быть менее слышимым (особенно без прямого сравнения с исходным аудиосигналом), чем в случае амплитудного ограничения.

Фиг. 5 схематично иллюстрирует представление частотной области фрагмента сигнала и результат воздействия по меньшей мере одного измененного параметра кодирования в соответствии с некоторыми альтернативными вариантами осуществления. В этом случае, это не самая значительная область частот, которая подвергается изменению до повторного кодирования фрагмента аудиосигнала, а область частот, которая является с точки зрения восприятия наименее важной, например, в соответствии с психоакустической теорией или моделью. В иллюстрируемом случае область/полоса частот между частотами f₃ и f₄ находится рядом с относительно сильной областью/полосой частот между f₂ и f₃. Поэтому область частот между f₃ и f₄, как обычно полагают, маскируется прилегающими двумя областями частот, которые содержат значительно более высокие вклады в сигнал. Тем не менее, область частот между f₃ и f₄ может способствовать возникновению события амплитудного ограничения в фрагменте декодированного сигнала. При снижении амплитуды/мощности сигнала для замаскированной области частот между f₃ и f₄ вероятность амплитудного ограничения может быть уменьшена в соответствии с требуемым пороговым уровнем без изменения, которое является слишком сильно слышимым или воспринимаемым для слушателя.

Хотя некоторые аспекты были описаны в контексте устройства, должно быть очевидно, что эти аспекты также представляют собой описание соответствующего способа, в котором блок или устройство соответствует этапу способа или признаку этапа способа. Аналогичным образом аспекты, описанные в контексте этапа способа, также представляют собой описание соответствующего блока или элемента или признака соответствующего устройства.

Соответствующий изобретению разложенный на составляющие сигнал может быть сохранен на носителе цифровых данных или может быть передан с помощью передающей среды, такой как беспроводная среда передачи информации или проводная среда передачи информации, такой как Интернет.

В зависимости от конкретных условий реализации, варианты осуществления изобретения могут быть реализованы в аппаратном обеспечении или в программном обеспечении. Реализация может быть выполнена с использованием носителя цифровых данных, например, гибкого диска, DVD (универсального цифрового диска), CD (компакт-диска), ROM (постоянного запоминающего устройства, ПЗУ), PROM (программируемого постоянного запоминающего устройства, ППЗУ), EPROM (стираемого программируемого ПЗУ), EEPROM (электрически-стираемого программируемого ПЗУ) или флэш-памяти, имеющей на ней считываемые электронным образом управляющие сигналы, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой так, что выполняется соответствующий способ.

Некоторые варианты осуществления в соответствии с изобретением содержат энергонезависимый носитель данных, имеющий считываемые электронным образом управляющие сигналы, которые способны взаимодействовать с программируемой компьютерной системой таким образом, что выполняется один из описанных в данном документе способов.

В общем, варианты осуществления настоящего изобретения могут быть реализованы в виде компьютерного программного продукта с программным кодом, при этом программный код действует для выполнения одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код может быть сохранен, например, на машиночитаемом носителе информации.

Другие варианты осуществления содержат компьютерную программу для выполнения одного из описанных в данном документе способов, хранящуюся на машиночитаемом носителе информации.

Другими словами, поэтому вариант осуществления способа, соответствующего изобретению, представляет собой компьютерную программу, имеющую программный код для выполнения одного из описанных в данном документе способов, когда компьютерная программа выполняется на компьютере.

Поэтому дополнительный вариант осуществления способов, соответствующих изобретению, представляет собой носитель данных (или среду для запоминания цифровых данных, или машиночитаемый носитель), содержащий записанную на нем компьютерную программу для выполнения одного из описанных в данном документе способов.

Поэтому дополнительный вариант осуществления способа, соответствующего изобретению, представляет собой поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из описанных в данном документе способов. Поток данных или последовательность сигналов могут быть, например, выполнены с возможностью передачи через соединение для передачи данных, например, через Интернет.

Дополнительный вариант осуществления содержит средство обработки данных, например, компьютер или программируемое логическое устройство, выполненное с возможностью или адаптированное для выполнения одного из описанных в данном документе способов.

Дополнительный вариант осуществления содержит компьютер с установленной на нем компьютерной программой для выполнения одного из описанных в данном документе способов.

В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может использоваться для выполнения некоторых или всех функциональных возможностей описанных в данном документе способов. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы выполнять один из описанных в данном документе способов. В общем, способы предпочтительно выполняются любым аппаратным устройством.

Описанные выше варианты осуществления представлены просто в качестве иллюстрации принципов настоящего изобретения. Следует понимать, что модификации и изменения относительных расположений и деталей, описанных в данном документе, будут очевидны специалистам в данной области техники. Поэтому по замыслу они должны быть ограничены лишь объемом нижеследующей формулы изобретения, а не конкретными деталями, представленными в данном документе в целях описания и пояснения вариантов осуществления.

1. Устройство кодирования аудиоинформации, содержащее
кодер для кодирования временного фрагмента входного аудиосигнала, подлежащего кодированию, для получения соответствующего кодированного фрагмента сигнала,
декодер для декодирования кодированного фрагмента сигнала для получения повторно декодированного фрагмента сигнала и
устройство обнаружения амплитудного ограничения для анализа повторно декодированного фрагмента сигнала относительно по меньшей мере одного из фактического амплитудного ограничения сигнала или перцепционного амплитудного ограничения сигнала и для формирования соответствующего предупреждения об амплитудном ограничении,
при этом кодер дополнительно выполнен с возможностью повторного кодирования временного фрагмента аудиосигнала по меньшей мере с одним измененным параметром кодирования, приводящим к пониженной вероятности амплитудного ограничения, в ответ на предупреждение об амплитудном ограничении, причем по меньшей мере один измененный параметр кодирования побуждает кодер изменять способ округления в устройстве квантования путем выбора меньшего порогового уровня квантования для частотного коэффициента.

2. Устройство кодирования аудиоинформации по п. 1, дополнительно содержащее
сегментатор для разделения входного аудиосигнала для получения по меньшей мере временного фрагмента.

3. Устройство кодирования аудиоинформации по п. 1, дополнительно содержащее
буфер фрагментов аудиосигнала для буферизации временного фрагмента входного аудиосигнала в виде буферизованного фрагмента, в то время как временной фрагмент кодируется кодером и соответствующий кодированный фрагмент сигнала повторно декодируется декодером,
причем предупреждение об амплитудном ограничении при определенных условиях вызывает подачу буферизованного фрагмента входного аудиосигнала снова в кодер для кодирования по меньшей мере с одним измененным параметром кодирования.

4. Устройство кодирования аудиоинформации по п. 3, дополнительно содержащее входной селектор для кодера, который выполнен с возможностью приема управляющего сигнала от устройства обнаружения амплитудного ограничения и выбора одного из временного фрагмента и буферизованного фрагмента в зависимости от управляющего сигнала.

5. Устройство кодирования аудиоинформации по п. 1, дополнительно содержащее
буфер кодированных фрагментов для буферизации кодированного фрагмента сигнала, в то время как он повторно декодируется декодером до его вывода устройством кодирования аудиоинформации, таким образом, чтобы он мог быть заменен потенциальным последующим кодированным фрагментом сигнала, который был кодирован с использованием по меньшей мере одного измененного параметра кодирования.

6. Устройство кодирования аудиоинформации по п. 1, в котором по меньшей мере один измененный параметр кодирования содержит общий коэффициент усиления, который применяется кодером к временному фрагменту.

7. Устройство кодирования аудиоинформации по п. 1, в котором по меньшей мере один измененный параметр кодирования побуждает кодер выполнять повторное квантование в частотной области по меньшей мере в одной выбранной области частот.

8. Устройство кодирования аудиоинформации по п. 7, в котором по меньшей мере одна выбранная область частот вносит наибольшее количество энергии в общий сигнал или является наименее подходящей с точки зрения восприятия.

9. Устройство кодирования аудиоинформации по п. 1, в котором способ округления изменяется для области частот, вносящей самый большой энергетический вклад.

10. Устройство кодирования аудиоинформации по п. 1, в котором способ округления дополнительно изменяется посредством увеличения точности квантования.

11. Устройство кодирования аудиоинформации по п. 1, в котором измененный параметр кодирования побуждает кодер вносить изменения по меньшей мере в одно из амплитуды и фазы по меньшей мере для одной области частот, чтобы уменьшить пиковую амплитуду.

12. Устройство кодирования аудиоинформации по п. 11, дополнительно содержащее анализатор слышимости для оценки слышимости внесенного изменения.

13. Устройство кодирования аудиоинформации по п. 11, дополнительно содержащее устройство определения пиковой амплитуды, соединенное с выходом декодера для проверки снижения пиковой амплитуды во временной области.

14. Устройство кодирования аудиоинформации по п. 13, выполненное с возможностью повторения внесения изменения по меньшей мере в одно из амплитуды и фазы и проверки снижения пиковой амплитуды во временной области до тех пор, пока пиковая амплитуда не станет ниже требуемого порогового уровня.

15. Способ кодирования аудиоинформации, содержащий этапы, на которых:
кодируют временной фрагмент входного аудиосигнала, подлежащего кодированию, для получения соответствующего кодированного фрагмента сигнала,
декодируют кодированный фрагмент сигнала для получения повторно декодированного фрагмента сигнала,
анализируют повторно декодированный фрагмент сигнала относительно по меньшей мере одного из фактического или перцепционного амплитудного ограничения сигнала,
формируют соответствующее предупреждение об амплитудном ограничении и,
в зависимости от предупреждения об амплитудном ограничении, повторяют кодирование временного фрагмента по меньшей мере с одним измененным параметром кодирования, приводящим к уменьшенной вероятности амплитудного ограничения, причем по меньшей мере один измененный параметр кодирования вызывает изменение способа округления путем выбора меньшего порогового уровня квантования для частотного коэффициента.

16. Способ по п. 15, дополнительно содержащий этап, на котором разделяют входной аудиосигнал для получения по меньшей мере временного фрагмента входного аудиосигнала.

17. Способ по п. 15 или 16, дополнительно содержащий этап, на котором:
буферизуют временной фрагмент входного аудиосигнала в виде буферизованного фрагмента, в то время как кодируется временной фрагмент и повторно декодируется соответствующий кодированный фрагмент сигнала,
кодируют буферизованный фрагмент по меньшей мере с одним измененным параметром кодирования.

18. Способ по п. 15, дополнительно содержащий этап, на котором буферизуют кодированный фрагмент сигнала, в то время как он повторно декодируется и до его вывода, таким образом, чтобы он мог быть заменен потенциальным последующим кодированным фрагментом сигнала, полученным повторным кодированием временного фрагмента с использованием по меньшей мере одного измененного параметра кодирования.

19. Способ по п. 15, в котором действие повторения кодирования содержит этап, на котором применяют посредством кодера общий коэффициент усиления к временному фрагменту, при этом общий коэффициент усиления определяется на основании измененного параметра кодирования.

20. Способ по п. 15, в котором действие повторения кодирования содержит этап, на котором выполняют повторное квантование в частотной области по меньшей мере в одной выбранной области частот.

21. Способ по п. 20, в котором по меньшей мере одна выбранная область частот вносит наибольшее количество энергии в общий сигнал или является наименее подходящей с точки зрения восприятия.

22. Способ по п. 21, в котором способ округления изменяется для области частот, вносящей самый большой энергетический вклад.

23. Способ по п. 21, в котором способ округления дополнительно изменяется посредством увеличения точности квантования.

24. Способ по п. 15, дополнительно содержащий этап, на котором:
вносят изменения по меньшей мере в одно из амплитуды и фазы по меньшей мере для одной области частот, чтобы уменьшить пиковую амплитуду.

25. Способ по п. 24, дополнительно содержащий этап, на котором оценивают слышимость внесенного изменения.

26. Способ по п. 24, дополнительно содержащий устройство определения пиковой амплитуды, соединенное с выходом декодера для проверки снижения пиковой амплитуды во временной области.

27. Способ по п. 26, дополнительно содержащий этап, на котором:
повторяют внесение изменения по меньшей мере в одно из амплитуды и фазы и проверку снижения пиковой амплитуды во временной области до тех пор, пока пиковая амплитуда не станет ниже требуемого порогового уровня.

28. Считываемый компьютером носитель, содержащий записанную на нем программу, которая побуждает компьютер или процессор обработки сигналов осуществлять этапы способа по п. 15.

Изобретение относится к средствам помехоустойчивой классификации режимов кодирования речи. Технический результат заключается в повышении эффективности классификации режимов речи для повышения эффективности многорежимного кодирования с переменной скоростью передачи данных.

Обнаружение высокого качества в стереофонических радиосигналах с частотной модуляцией // 2584009

Изобретение относится к области связи, в частности к обработке звуковых сигналов, и предназначено для повышения качества принимаемого стереофонического звукового FM-сигнала и выбора соответствующей обработки на основании обнаруженного качества.

Способ (варианты) фильтрации зашумленного речевого сигнала в условиях сложной помеховой обстановки // 2580796

Изобретения относятся к области цифровой связи и технологиям обработки речи в условиях зашумления. Технический результат заключается в повышении отношения сигнал-шум очищенного речевого сигнала.

Способ обработки функции автокорреляции для измерения основного тона речевого сигнала // 2559710

Изобретение относится к средствам обработки функции автокорреляции для измерения основного тона речевого сигнала и может быть использовано в области обработки сигналов, в системах распознавания речи.

Способ определения риска развития заболеваний индивида по его голосу и аппаратно-программный комплекс для реализации способа // 2559689

Изобретение относится к медицине и предназначено для исследования функционального состояния голосовых складок. Техническим результатом является повышение точности диагностики состояния здоровья индивида по параметрам голосового сигнала.

Способ выявления эмоционального состояния человека по голосу // 2553413

Изобретение относится к системам анализа речи и может быть использовано для определения эмоционального состояния человека по голосу, применительно к задачам криминалистики, медицины, системам контроля и управления доступом и др.

Устройство, способ и машиночитаемый носитель для получения параметра, описывающего изменение характеристики сигнала // 2543308

Группа изобретений относится к средствам для анализа временных вариаций аудио сигналов. Технический результат заключается в создании средств, обладающих повышенной надежностью, для получения параметра, описывающего временные изменения сигнальной характеристики.

Способ выделения речевого сигнала в условиях наличия помех и устройство для его осуществления // 2536343

Изобретение относится к вычислительной технике. Технический результат заключается в повышении эффективности выделения речевого сигнала в условиях наличия помех.

Способ оценки качества аудиосигнала, устройство и считываемый компьютером записываемый носитель, записывающий программу // 2517393

Изобретение относится к средствам оценки качества аудиосигнала для мультимедийной телекоммуникационной службы. Технический результат заключается в повышении точности определения качества аудиосигнала.

Способ и дискриминатор для классификации различных сегментов сигнала // 2507609

Способ и дискриминатор для классификации различных сегментов сигнала, предназначенный для того, чтобы классифицировать различные сегменты сигнала, включающий сегменты, по крайней мере, первого и второго типов, например музыкальные и речевые сегменты, сигнал краткосрочной классификации (150) на основе, по крайней мере, одной краткосрочной особенности, извлеченной из сигнала, и краткосрочный результат классификации (152); сигнал долгосрочной классификации (154) на основе, по крайней мере, одной краткосрочной особенности и, по крайней мере, одной долгосрочной особенности, извлеченной из сигнала, и долгосрочный результат классификации (156).

Устройство для формирования улучшенного сигнала микширования с понижением, способ формирования улучшенного сигнала микширования с понижением и компьютерная программа // 2586851

Изобретение относится к технике связи. Технический результат - обеспечение формирования улучшенного сигнала микширования с понижением.

Декодер звукового сигнала, кодирующее устройство звукового сигнала, способы и компьютерная программа, использующие зависящее от частоты выборки кодирование контура деформации времени // 2586848

Изобретение относится к средствам кодирования и декодирования звукового сигнала. Технический результат заключается в повышении эффективности кодирования.

Декодер водяного знака и способ формирования данных двоичного сообщения // 2586845

Изобретение относится к средствам передачи данных двоичного сообщения. Технический результат заключается в оптимизации формирования данных двоичного сообщения в зависимости от сигнала, маркированного водяным знаком, которое позволило бы увеличить объем данных двоичного сообщения, получаемых с сигналом с водяным знаком.

Генератор водяного знака, декодер водяного знака, способ генерации сигнала водяного знака на основе данных двоичного сообщения, способ формирования данных двоичного сообщения на основе сигнала с водяным знаком и компьютерная программа с использованием дифференциального кодирования // 2586844

Изобретение относится к средствам генерирования, кодирования и декодирования водяного знака. Технический результат заключается в повышении надежности в случае воздействия на сигнал водяного знака доплеровского сдвига частоты.

Устройство и способ преобразования первого параметрического пространственного аудиосигнала во второй параметрический пространственный аудиосигнал // 2586842

Изобретение относится к области обработки звука, а именно к области параметрического пространственного преобразования звука с трансформацией первого параметрического пространственного аудиосигнала во второй параметрический пространственный аудиосигнал.

Многорежимный аудио кодировщик и celp кодирование, адаптированное к нему // 2586841

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении регулировки общего усиления без декодирования и дополнительного этапа повторного кодирования.

Аудиокодек, использующий синтез шума в течение неактивной фазы // 2586838

Изобретение относится к аудиокодеку, поддерживающему синтез шума в течение неактивных фаз. Техническим результатом является уменьшение скорости передачи битов с поддержанием достижимого качества формирования шума.

Кодирование и декодирование позиций импульсов дорожек аудиосигнала // 2586597

Изобретение относится к средствам кодирования и декодирования закодированного аудиосигнала. Технический результат заключается в обеспечении кодирования и декодирования информации импульсов с использованием меньшего количества битов для представления информации импульсов, что обеспечит возможность уменьшения скорости передачи соответствующим образом закодированного аудиосигнала.

Генерирование шума в аудиокодеках // 2585999

Изобретение относится к средствам генерирования шума в аудиокодеках. Технический результат заключается в обеспечении уменьшения скорости передачи битов и в повышении качества генерируемого шума.

Устройство и способ обработки речевого/аудио сигнала // 2585987

Изобретение относится к средствам обработки речевого/аудио сигнала. Технический результат заключается в обеспечении комфортного воспроизведения звука во время переключения полосы пропускания речевых/аудио сигналов.

Устройство формирования водяных знаков, устройство декодирования водяных знаков, способ обеспечения сигнала с водяным знаком на основе данных, содержащих дискретные значения, и способ обеспечения данных, содержащих дискретные значения, в зависимости от сигнала с водяным знаком // 2586877

Изобретение относится к системе связи и предназначено для формирования водяных знаков для обеспечения сигнала с водяным знаком на основе данных, содержащих дискретные значения. Технический результат - повышение устойчивости сигнала водяного знака. Устройство содержит устройство дифференциального кодирования, выполненное с возможностью применения чередования фаз к текущему потоковому значению из потоковых значений или к текущему символу водяного знака, причем текущий символ водяного знака соответствует текущему потоковому значению из потоковых значений, чтобы получить текущий коэффициент водяного знака сигнала водяного знака. Устройство дифференциального кодирования выполнено с возможностью извлечения фазы предыдущего спектрального коэффициента сигнала с водяным знаком, который является объединением главного сигнала и сигнала водяного знака, также выполнено с дополнительной возможностью обеспечения сигнала водяного знака, такого, что фазовый угол чередования фаз, применяемый к текущему потоковому значению или к текущему символу водяного знака, зависит от фазы предыдущего спектрального коэффициента сигнала с водяным знаком. 5 н. и 10 з.п. ф-лы, 16 ил.