Кодирование с множеством скоростей

Изобретение относится к кодированию с множеством скоростей, более конкретно к речевому кодированию с множеством скоростей для систем связи. В соответствии с вариантом осуществления изобретения предусмотрен способ многоскоростного кодирования в системе связи. Способ включает этап обеспечения кодека с набором настраиваемых параметров для использования при выборе режимов кодека. Каждый набор параметров настройки обеспечивает некоторую среднюю битовую скорость. Принимается заданное значение битовой скорости для кодирования сигнала кодеком, причем это целевое значение битовой скорости имеет некоторое значение между минимальной и максимальной средней битовой скоростью кодека. Затем режим кодирования выбирается на основе целевого значения битовой скорости и наборов параметров настройки, и сигнал кодируется посредством использования выбранного режима кодирования. Также предусмотрен многоскоростной кодек, содержащий селектор для выбора режима кодирования из набора режимов кодирования на основе целевого значения битовой скорости. Технический результат - повышение качества речи за счет кодирования с переменной скоростью в результате более эффективного кодирования. 3 н. и 21 з.п. ф-лы, 5 ил.

 

Область техники

Настоящее изобретение относится к кодированию с множеством скоростей, более конкретно, но не исключительно, к речевому кодированию с множеством скоростей для систем связи. Другими, не ограничивающими примерами возможного применения могут служить кодирование аудиоданных и кодирование видеоданных.

Предшествующий уровень техники

Систему связи можно рассматривать как аппаратуру, которая обеспечивает осуществление сеансов информационного обмена между двумя или более объектами, такими как пользовательская аппаратура и/или другие узлы, связанные с системой. Информационный обмен может включать, например, передачу речи, данных, мультимедийных данных и т.д. Система связи может обеспечивать интерфейсы стационарных линий связи и/или беспроводной связи. Системы мобильной связи относятся в принципе к любым телекоммуникационным системам, которые обеспечивают возможность беспроводной связи, когда пользователи перемещаются в пределах зоны обслуживания системы. Типовой системой мобильной связи является система PLMN (наземная мобильная сеть общего пользования). Другим примером систем беспроводной связи является система WLAN (беспроводная локальная сеть). Примером системы со стационарными линиями связи является система PSTN (коммутируемая телефонная сеть общего пользования).

Практически все современные приложения телефонной связи используют сжатие речи для повышения эффективности использования среды передачи. Функциональный блок, который выполняет сжатие, называется речевым кодеком. Речевой кодек кодирует речь для преобразования в цифровой формат для передачи. Соответственно, речевой кодек декодирует на выходе приемника восстановленные биты для получения восстановленного речевого сигнала. Большинство из современных речевых кодеков работают путем обработки речевого сигнала в коротких сегментах, называемых кадрами. Например, все кодеки стандарта GSM (глобальная система мобильной связи), включая кодек AMR (адаптивный многоскоростной кодек), используют кадры длительностью 20 мс.

Многоскоростные речевые кодеки могут предусматриваться для кодирования в различных коммуникационных стандартах. Например, многоскоростные речевые кодеки могут использоваться для связи в мобильных сетях, таких как основанные на широкополосном множественном доступе с кодовым разделением каналов (WCDMA), сети стандартов GSM/EDGE (глобальная система мобильной связи/улучшенные скорости передачи данных для усовершенствования GSM) и другие сети третьего поколения (3G). Многоскоростное речевое кодирование может быть использовано как в системах с коммутацией каналов, так и в системах с коммутацией пакетов. Оно также может быть использовано в приложениях, связанных с передачей сообщений, таких как MMS (передача мультимедийных сообщений). Многоскоростное речевое кодирование является предпочтительным, например, для передачи по каналам с ошибками или с ограниченными возможностями передачи.

Вышеупомянутый адаптивный многоскоростной режим (AMR) является примером многоскоростных речевых кодеков. AMR-кодеки могут быть использованы для узкополосных и широкополосных приложений. Хотя AMR-кодеки первоначально были разработаны для радиоканалов стандартов GSM/EDGE и WCDMA, они могут применяться где угодно, например, в сетях с коммутацией пакетов. Например, речевой AMR-кодек был выбран для использования в системах третьего поколения (3G-системах). AMR-кодеки могут содержать 8 или 9 активных речевых режимов и функциональные средства прерывистой передачи (DTX).

Многоскоростные кодеки могут использовать различные режимы кодирования. В известных многоскоростных кодеках выбор режима может основываться только на характеристиках качества передачи, таких как пропускная способность сети и условия радиоканала. Сеть радиосвязи может использовать множество скоростей для адаптации линии связи к условиям замираний в канале и пакетам ошибок. В сети, которая основывается на быстродействующем управлении мощностью, многоскоростная структура может использоваться для управления пропускной способностью сети.

Дальнейшее развитие состоит в использовании управляемой источником переменной битовой скорости в целях снижения средней битовой скорости источника без заметного ухудшения качества декодированной речи. Ожидаемое преимущество пониженной средней битовой скорости заключается в пониженной средней мощности передачи и, следовательно, более высокой пропускной способности передающей системы. Также приложения, связанные с хранением, могут получить выгоду от основанной на источнике адаптации битовой скорости за счет использования меньшего пространства памяти или за счет сохранения речевого сигнала более высокого качества на имеющемся пространстве памяти.

Различные алгоритмы основанной на источнике адаптации битовой скорости могут использоваться для определения наилучшего с точки зрения восприятия (перцептуально наилучшего) режима кодека для каждого речевого кадра. Прерывистая передача (DTX), управляемая на основе определения речевой активности (VAD), является, вероятно, наиболее широко используемым алгоритмом для оптимизации пропускной способности сети на основе сигнала источника.

Фиг.3 иллюстрирует известную конфигурацию для реализации алгоритма кодирования с переменной скоростью. Известные алгоритмы кодирования с переменной скоростью, такие как алгоритм вокодера выбираемого режима (SMV) в сети стандарта IS-95, выбирают битовую скорость параметров кодирования перед кодированием сигнала. Затем алгоритм вокодера выбираемого режима (SMV) выбирает для каждого речевого кадра одну из четырех возможных скоростей кодирования.

Выбор битовой скорости выполняется согласно алгоритму определения скорости (DRA). Выбор скорости основывается на характеристиках кадра, таких как вокализованная речь, невокализованная речь и т.д., и управляется режимом работы алгоритма. Алгоритм определения скорости имеет 4 основных режима работы: Режим 0 (улучшенный режим), Режим 1 (стандартный режим), Режим 2 (экономичный режим) и Режим 3 (сверхэкономичный режим). Каждый из различных режимов дает отличающуюся среднюю битовую скорость для входного речевого сигнала. Это обеспечивает установленный компромисс между средней скоростью передачи данных и качеством речи.

Таким образом, известный кодек переменной скорости предусматривает группу речевых кодеков с разными битовыми скоростями. Каждый режим обеспечивает некоторую среднюю битовую скорость с определенным допуском. Каждый режим предусматривает определенное использование соответствующего речевого кодека, так что режимы с более высокой средней битовой скоростью получают бóльшую часть времени использования доступных речевых кодеков, чем речевые кодеки с более низкими битовыми скоростями.

Известные реализации кодеков не поддерживают ни основанную на источнике адаптацию скорости, ни управление средней битовой скорости для активной, т.е. непрерывной речи. Например, в широкополосных и узкополосных многоскоростных речевых кодеках определение речевой активности (VAD) используется, чтобы понизить битовую скорость на периодах молчания. Однако хотя битовая скорость может быть изменена во время активной речи на основе условий канала передачи за счет адаптации линии связи, битовая скорость не может быть изменена во время активной речи на основе речевого сигнала источника.

Ниже описан пример того, как можно осуществить выбор режима в известном уровне техники на основе речевых характеристик. Известный алгоритм выбора режима использует вычисленные речевые параметры из текущего и последних речевых кадров для классификации речи в различные виды классов. Поэтому речевой режим для каждого речевого кадра выбирается в соответствии с определенным классом речи. Классы речи могут соответствовать, например, последовательностям с низкой энергией, нестационарностям, невокализованным и вокализованным последовательностям. Алгоритм адаптации источника может использовать спектральное содержание, усиление, частоту пересечения нулей предыдущих речевых кадров для нахождения класса для текущего речевого сигнала. Затем кодирование речи осуществляется на основе определенного класса речи. В течение нестационарных последовательностей качество речи может ухудшаться очень быстро, если используются режимы с более низкими битовыми скоростями.

Известный алгоритм адаптации источника может работать для каждого речевого кадра. В этом примере действующий набор режимов обеспечивает требуемую информацию о доступных режимах речевого кодека. Приведенный для примера алгоритм использует три режима из действующего набора кодеков, каждый с отличающейся битовой скоростью. Режим с наивысшей битовой скоростью может использоваться для кодирования нестационарных, невокализованных и некоторых вокализованных последовательностей. Режим с самой низкой битовой скоростью может использоваться для кодирования последовательностей с низким уровнем энергии. Все другие случаи, которые не классифицированы соответственно этим двум типам последовательностей, кодируются с использованием режима, имеющего среднюю битовую скорость. Приведенный для примера алгоритм адаптации источника использует вариацию по частоте содержимого речи и оценку остаточной ошибки. Остаточная ошибка является разностью между синтезированной речью и входной, т.е. исходной речью. Остаточная ошибка является одной переменной, которая может использоваться для принятия решения о разрешении при кодировании, т.е. для выбора режима работы речевого кодека, и поэтому может учитываться в адаптации источника. Усиление фиксированной кодовой книги используется как оценка остаточной ошибки, и оно масштабируется на основе шумов фона и уровня мощности речевого сигнала. Частотное содержание анализируется путем вычисления частоты пересечений нуля по каждому кадру и анализа его изменения. При вычислении порогов принятия решения в этом алгоритме используются уровни речи и шума, усиление фиксированной кодовой книги и действующий набор речевых режимов.

В примере, описанном выше, средняя битовая скорость может быть выбрана только из предварительно определенного набора дискретных значений. Поэтому управление средней битовой скоростью не может осуществляться достаточно гибко для всех приложений при установлении компромисса между качеством речи и пропускной способностью системы.

В известной архитектуре многоскоростного кодирования битовая скорость управляется оператором сети. Управление позволяет оператору уравновешивать пропускную способность для речевого сигнала и качество речевого сигнала. Оператор может принять решение переключиться на более низкие фиксированные битовые скорости в периоды максимальной нагрузки для повышения пропускной способности. Однако в известном решении оператор может управлять битовой скоростью только с использованием фиксированных значений (например, 4,75, 7,40,…, 12,2 кб/с). Битовые скорости, доступные для оператора, представляют собой битовые скорости режимов в действующем наборе режимов.

Это может создавать проблемы в некоторых ситуациях. Качество речи может быстро снижаться, когда используемый режим переключается на более низкую фиксированную битовую скорость. Сеть не может управляться и оптимизироваться достаточно гибким способом. Например, если сеть может использовать три режима 4,75, 7,40 и 12,2 кб/с в качестве поднабора, то может оказаться затруднительным оптимизировать сетевую нагрузку, например, для 100 или более пользователей. Единственным решением для оператора в этом примере было бы переключение всех или большинства пользователей из режима 12,2 кбит/с в режим 4,75 кбит/с. Однако это вызвало бы значительное ухудшение качества речи.

Кроме того, если желательное число дискретных целевых битовых скоростей является высоким или неизвестно при проектировании кодека, то может оказаться довольно затруднительным и требующим больших временных затрат создание и оптимизация больших таблиц параметров для каждой возможной целевой битовой скорости. Можно привести пример системы, работающей с целевыми скоростями от 4,75 до 12,2 кб/с, в которой оператор желает изменять битовую скорость шагами по 200 б/с. В этом примере необходимо было бы оптимизировать и сохранить около 40 различных наборов параметров для отличающихся битовых скоростей. Это потребовало бы значительного объема работы по применению кодека в системе, требующей данное количество дискретных битовых скоростей, и было бы еще более затруднительным в системе, требующей всех непрерывно изменяющихся целевых битовых скоростей.

Сущность изобретения

Варианты осуществления изобретения нацелены на решение одной или нескольких из вышеуказанных проблем.

В соответствии с вариантом осуществления настоящего изобретения предусмотрен способ многоскоростного кодирования в системе связи. Способ включает этап обеспечения кодека с набором настраиваемых параметров для использования при выборе режимов кодека. Каждый набор параметров настройки обеспечивает некоторую среднюю битовую скорость. Принимается заданное (целевое) значение битовой скорости для кодирования сигнала кодеком, причем это целевое значение битовой скорости имеет некоторое значение между минимальной и максимальной средней битовой скоростью кодека. Затем режим кодирования выбирается на основе целевого значения битовой скорости и наборов параметров настройки, и сигнал кодируется посредством использования выбранного режима кодирования.

Согласно другому варианту осуществления изобретения предусматривается многоскоростной кодек, содержащий кодер для кодирования сигналов и источник для обеспечения набора параметров настройки. Каждый набор параметров настройки обеспечивает некоторую среднюю битовую скорость. Кодек также содержит вход для подачи целевого значения битовой скорости, причем это целевое значение битовой скорости имеет некоторое значение между минимальной и максимальной средней битовой скоростью кодека, и селектор для выбора режима кодирования из набора режимов кодирования на основе целевого значения битовой скорости и наборов параметров настройки. Кодек выполнен с возможностью кодирования сигналов посредством использования режима кодирования, выбранного селектором.

Согласно другому варианту осуществления изобретения предусмотрена система связи, содержащая передающий узел, снабженный кодером для кодирования сигналов, и приемный узел, снабженный декодером для декодирования сигналов, переданных от передающего узла. Система содержит память для хранения наборов параметров настройки, причем каждый набор параметров настройки обеспечивает некоторую среднюю битовую скорость, вход для подачи целевого значения битовой скорости, причем это целевое значение битовой скорости имеет некоторое значение между минимальной и максимальной средней битовой скоростью кодека и селектор для выбора режима кодирования из набора режимов кодирования на основе целевого значения битовой скорости и наборов параметров настройки, при этом кодек выполнен с возможностью кодирования сигналов посредством использования режима кодирования, выбранного селектором.

В конкретных вариантах осуществления изобретения целевое значение битовой скорости может изменяться в течение действующего соединения.

Режим может выбираться на основе набора параметров настройки, определенных для различных целевых значений битовой скорости. Выбор параметров настройки может быть основан на оценке средней битовой скорости и целевом значении битовой скорости. Параметры алгоритма выбора режима могут основываться на целевом значении битовой скорости. Пороговые значения для выбора могут устанавливаться на основе целевого значения битовой скорости.

Кодек может работать таким образом, что средняя битовая скорость кодека устанавливается на целевую битовую скорость. Средняя битовая скорость может формироваться путем перехода между по меньшей мере двумя режимами различных фиксированных битовых скоростей в соответствии с по меньшей мере одним набором параметров настройки.

Выбор режима может выполняться посредством контура, образованного функцией оценки средней битовой скорости, функцией настройки целевого значения битовой скорости, источником параметров настройки и алгоритмом выбора режима.

Этап выбора режима кодирования может включать в себя осуществляемый селектором адаптивный переход между различными наборами параметров настройки, определенными для различных целевых значений битовой скорости.

При выборе режима кодирования может использоваться дополнительная информация в дополнение к целевому значению битовой скорости.

Варианты осуществления изобретения могут предусматривать адаптивный по источнику кодек, обеспечивающий более гибкое и оптимизированное использование переменных битовых скоростей. Может быть обеспечен непрерывный, реализуемый по существу в реальном времени компромисс между пропускной способностью для речи и качеством речи. Качество речи может быть увеличено за счет кодирования с переменной скоростью в результате более эффективного кодирования. Может быть обеспечена экономия питающей мощности за счет того, что кодирование может осуществляться с меньшими битовыми скоростями.

Краткое описание чертежей

Настоящее изобретение поясняется ниже на примере со ссылками на чертежи, где показано следующее:

Фиг.1 - схематичное представление конфигурации связи с использованием речевых кодеков;

Фиг.2 - схематичное представление речевого кодера, выполненного с возможностью обеспечения основанной на источнике адаптации битовой скорости;

Фиг.3 - структура известного алгоритма определения битовой скорости;

Фиг.4 - структура алгоритма определения битовой скорости в соответствии с вариантом осуществления изобретения;

Фиг.5 - блок-схема последовательности операций, иллюстрирующей работу варианта осуществления настоящего изобретения.

Описание предпочтительных вариантов осуществления изобретения

Ниже более подробно описаны возможные механизмы настройки битовой скорости для обеспечения адаптируемого на основе источника речевого кодека. В этой связи ссылка дается на фиг.1, где представлена система связи, в которой может быть использовано настоящее изобретение. Показанная система связи может обеспечивать услуги беспроводной передачи данных для мобильного пользовательского устройствам 1 посредством системы 8 PLMN (наземная мобильная сеть общего пользования).

Пользовательское устройство 1 содержит речевой кодек 10. Его работа более подробно описана ниже после краткого описания других возможных признаков пользовательского устройства и возможных элементов коммуникационной сети.

Специалисты в данной области техники знакомы с особенностями и принципом работы типового мобильного пользовательского устройства. Поэтому достаточно отметить, что пользователь может использовать мобильное пользовательское устройство 1 для выполнения таких задач, как осуществление и прием телефонных вызовов, для приема информационного содержания из сети и для просмотра содержимого, которое может быть представлено пользователю посредством дисплея и/или динамика и для интерактивного согласования с другой стороной. Пользовательское устройство 1 может быть снабжено такими средствами, как средство обработки данных, средство памяти, антенна 4 для беспроводного приема от базовых станций и передачи сигналов к ним и дисплей 2 для отображения изображений и другой визуальной информации для пользователя мобильного пользовательского устройства, динамик 5, микрофон 6, кнопки 3 управления и т.д.

Следует отметить, что приведенное в качестве примера пользовательское устройство и различные элементы пользовательского устройства показаны только для описания возможного контекста реализации изобретения. Кроме того, следует иметь в виду, что термин “мобильная станция” включает в свой объем любой тип беспроводного пользовательского устройства, такого как мобильные телефоны, портативные устройства обработки данных или портативные Web-браузеры.

Также кратко пояснены элементы сети PLMN 8, чтобы пояснить работу типовой сети. Мобильная станция или другое соответствующее пользовательское устройство 1 выполнены с возможностью осуществления связи через интерфейс радиосвязи с приемопередающим элементом 12 сети радиодоступа сети PLMN. Приемопередающий элемент 12 может представлять собой базовую станцию. Термин “базовая станция”, используемый в настоящем описании, включает в свой объем все объекты, которые могут осуществлять передачи к беспроводным станциям или прием от беспроводных станций через интерфейс радиосвязи. Базовая станция 12 управляется контроллером сети радиосвязи (RNC) 14.

Сеть 8 также содержит блок 16 транскодера, который содержит два речевых кодека 10 и 11. Кодек 10 предназначен для кодирования речи для передачи по прямой линии связи к мобильному пользовательскому устройству 1. Кодек 11 предназначен для декодирования передач, принимаемых по обратной линии связи от пользовательского устройства 1 и кодированных кодеком пользовательского устройства 1. Ясно, что блок 16 транскодера может быть встроен в любой соответствующий сетевой узел, такой как контролер 12 сети радиосвязи. Кроме того, кодек может использоваться как для кодирования, так и для декодирования.

Речевой кодек 10 пользовательского устройства 1 может содержать адаптивный многоскоростной речевой кодек. Предварительно обработанный сигнал с микрофона 6 может кодироваться с использованием любого соответствующего кодирования, например широко используемой технологии ACELP (алгебраическое линейное прогнозирование с кодовым возбуждением). При использовании метода ACELP выходной битовый поток кодера может содержать параметры типового кодера ACELP. Неограничительными примерами таких параметров могут служить параметры LPC (кодирование методом линейного предсказания), квантованные по области LSP (пара спектральных линий) или ISP (пара спектральных иммитансов), описывающие спектральное содержимое, параметры LTP (долгосрочный прогноз), описывающие периодическую структуру, параметры возбуждения ACELP, описывающие остаточный сигнал после линейных предсказателей и параметры усиления сигналов.

Кодированный битовый поток после анализа ACELP передается от пользовательского устройства 1 по обратной линии связи к декодеру 11 сети. После основного процесса декодирования синтезированный сигнал подвергается постпроцессорной обработке для генерации действительного выходного сигнала 18 с декодера 11. Декодеру может потребоваться информация о режиме, например, потому, что декодирование квантования параметров LSP, LTP и возбуждения ACELP может зависеть от используемого режима кодека.

Кодирующий кодек 10 может быть адаптирован для использования многоскоростной схемы. Скорость и режим могут изменяться между последовательными кадрами. Режим кодека может даже выбираться независимо для каждого кадра анализа, например, с интервалами 20 мс. Выбор соответствующего режима может зависеть от таких особенностей, как характеристики источника сигнала, желательное целевое значение средней битовой скорости и набор поддерживаемых режимов.

Ниже приведенный для примера способ управления битовой скоростью многоскоростного речевого кодека описан более детально со ссылкой на кодек 10 на фиг.2, алгоритм определения скорости, схематично показанный на фиг.4, и блок-схему способа по фиг.5.

В описываемом приведенном для примера варианте осуществления битовая скорость речевого кодека может настраиваться на основе целевого значения битовой скорости. Средняя битовая скорость, используемая для речевой передачи по беспроводному каналу, может настраиваться непрерывно на основе доступных режимов кодека и нагрузки сети радиосвязи.

На фиг.2 показана блок-схема возможных функциональных блоков многоскоростного речевого кодека 10 в соответствии с настоящим изобретением. Кодек содержит блок 19 алгоритма определения речевой активности (VAD), предназначенный для приема входной речи 9. Ввод речевого сигнала также показан на этапе 100 на фиг.5. Блок 19 VAD выполнен с возможностью подачи речевого сигнала на блок 32 прерывистой передачи (DTX) для обработки речевого сигнала в соответствии с выбранным режимом кодека. Блок VAD 19 может также вводить речевой сигнал в блок 20 алгоритма основанной на источнике адаптации битовой скорости (SBRA).

Блок 20 алгоритма основанной на источнике адаптации битовой скорости предназначен для адаптации битовой скорости кодека на основе желательного целевого значения битовой скорости. На фиг.5 целевое значение битовой скорости вводится в кодек на этапе 102. Введенное целевое значение 22 битовой скорости используется блоком 20 для выбора соответствующего режима кодирования для использования в блоке 30 кодирования из набора возможных режимов на этапе 104. На этом этапе параметры настройки извлекаются из источника параметров настройки, например, из памяти, предусмотренной в качестве интегральной части кодека, или из внешнего источника.

Параметры настройки упорядочены в наборы параметров настройки. Набор параметров настройки предпочтительно определяет режим, который формирует предварительно определенную среднюю битовую скорость для сигнала источника с определенными характеристиками сигнала источника. В предпочтительном варианте осуществления средняя битовая скорость формируется путем переходов между режимами различных фиксированных битовых скоростей. Поскольку наборы параметров настройки связаны с различными характеристиками источника сигнала, выбранный режим фиксированной битовой скорости также зависит от характеристик источника сигнала.

Использование наборов параметров настройки обеспечивает конфигурацию замкнутого контура управления, в котором заданное целевое значение средней битовой скорости может быть достигнуто с использованием различных наборов настроек, полученных из источника параметров настроек. Ряд наборов параметров настроек может использоваться для выбора режимов кодека на основе целевого значения битовой скорости.

Значения параметров настойки могут настраиваться вручную для получения наиболее оптимальной комбинации различных параметров настройки. Параметры могут выбираться для определения критериев и вычисления пороговых значений на основе того, какой режим кодека может быть выбран. Каждый набор параметров настройки может обеспечить отличающуюся среднюю битовую скорость. Целевое значение битовой скорости может быть затем получено путем изменения набора параметров настройки в соответствии с предварительно определенным правилом управления. В простом случае правило управления может быть таким, чтобы набор параметров для выбора режима изменялся соответственно определенной разности между оценкой средней битовой скорости и заданным целевым значением битовой скорости.

Наборы параметров настойки могут быть установлены для обеспечения различных средних битовых скоростей. Наборы могут быть установлены так, что при выборе обеспечивается некоторый допуск.

По меньшей мере, один кадр речевого сигнала с выхода блока 32 DTX может затем кодироваться посредством соответствующего метода кодирования в выбранном режиме, как показано на этапе 106. Желательная средняя битовая скорость может быть сформирована посредством переходов между различными режимами фиксированных битовых скоростей кодека.

Если на этапе 108 установлено, что требуется новое целевое значение битовой скорости, то вводится новое целевое значение битовой скорости и режим кодирования выбирается, как описано выше. Если целевое значение битовой скорости остается тем же самым, то кодирование кадров продолжается на этапе 110 с использованием режима, выбранного на этапе 104.

Возможный принцип работы блока 20 алгоритма адаптации описан ниже более детально со ссылкой на фиг.4. Блок 20 алгоритма определения скорости содержит блок 21 функции настройки целевого значения битовой скорости, блок 23 кодовой книги, блок алгоритма выбора режима, блок 25 настройки режима и блок 26 оценки средней битовой скорости.

Целевое значение 22 битовой скорости, вводимое в блок 21 функции настройки, может быть установлено произвольным образом для обеспечения нахождения в определенном диапазоне битовых скоростей. Диапазон предпочтительно зависит от битовых скоростей доступных режимов кодека, чтобы обеспечивалось перекрытие всех доступных битовых скоростей.

Сравнение фиг.3 и 4 показывает отличие принципа, лежащего в основе изобретения, от известного алгоритма определения скорости (RDA) вокодера с выбираемым режимом (SMV), описанного выше и показанного на фиг.3, заключающееся в том, что в изобретении режим кодирования выбирается на основе целевого значения битовой скорости. В предпочтительном варианте осуществления алгоритм выбора настраивает битовую скорость на основе результатов оценки средней битовой скорости. Параметры, используемые алгоритмом при выборе режима, устанавливаются на основе целевого значения битовой скорости. Например, пороговые значения выбора в алгоритме выбора режима могут устанавливаться на основе целевого значения битовой скорости.

Не требуется, чтобы целевое значение 22 битовой скорости было равным битовой скорости в заданном режиме, как это имеет место в предшествующем уровне техники. Вместо этого, целевое значение битовой скорости может быть выбрано как желательная средняя битовая скорость для кодирования. Целевое значение битовой скорости может устанавливаться и управляться оператором сети.

Вариант осуществления обеспечивает группу различных речевых кодеков посредством выбираемых режимов. Например, могут быть обеспечены различные режимы адаптивных многоскоростных речевых кодеков с различными битовыми скоростями.

Блок 20 алгоритма определения скорости (RDA) может согласовывать среднюю битовую скорость с целевым значением битовой скорости. Это может быть сделано посредством контура, образованного оценкой средней битовой скорости в блоке 26, настройки целевого значения битовой скорости в блоке 21, кодовой книги настройки в блоке 23 и алгоритма выбора режима в блоке 24.

Возможным способом реализации управляемого источником кодека переменной скорости является использование предварительно определенных наборов значений параметров настройки для средних битовых скоростей для обеспечения выбора режима. На фиг.2 наборы параметров настройки обеспечиваются посредством блока 23 кодовой книги настройки.

Блок 25 установки режима предназначен для определения действующего набора режимов. Действующий набор режимов представляет собой группу режимов речевого кодека, которые являются доступными для кодирования. Режимы могут быть упорядочены в порядке увеличения битовой скорости. Примером действующего набора режимов может быть следующий:

M1set = [4,75кб/с 5,90кб/с 7,40кб/с 12,2кб/с]

где M1set - режим с самой низкой скоростью кодирования.

Рабочим режимом является наивысший режим в действующем наборе кодеков. Этот режим может быть выбран в соответствии с условиями в канале, например, посредством адаптации линии связи.

Не требуется, чтобы все режимы кодеков поддерживались для алгоритма, основанного на источнике выбора битовой скорости. Поэтому действующий набор режимов может быть поднабором всех возможных режимов речевых кодеков.

Блок 26 оценки средней битовой скорости предназначен для оценки средней битовой скорости уже кодированных речевых кадров. Средняя битовая скорость может быть основана на предыстории. Например, средняя битовая скорость может быть вычислена для последних 100 кадров.

Блок 23 кодовой книги настройки содержит параметры настройки, предназначенные для использования в алгоритме выбора режима. Кодовая книга настройки может содержать ряд параметров настройки, оптимизируемых вручную или иным образом, для ряда фиксированных целевых значений битовых скоростей. Кодовая книга настройки может снижать сложность выбора режима, чтобы число возможных вариантов выбора в наборе параметров настройки было меньше, чем число возможных целевых значений битовой скорости. Например, кодовая книга настройки может содержать значения параметров только для нескольких средних битовых скоростей. Целевые значения битовых скоростей между этими значениями могут затем быть реализованы путем поочередного использования различных индексов кодовой книги настройки для достижения целевого значения средней битовой скорости.

Алгоритм адаптации битовой скорости сравнивает анализируемые речевые параметры с определенными пороговыми значениями. Значения используемых порогов зависят от установленного целевого значения битовой скорости.

Например, пороговые значения, используемые при выборе режима, могут быть сохранены в блоке 23 кодовой книги настройки. Кодовая книга настройки может представлять собой матрицу, где каждая строка включает набор настраиваемых пороговых значений для некоторой средней битовой скорости. Поэтому столбец может включать все настроенные значения для определенных пороговых значений. Например, элемент из матрицы ТСВ, приведенной ниже, может указывать а-й параметр настройки для средних битовых скоростей Хr кб/с. Индекс, указывающий на первую строку, может затем дать набор параметров для наивысшей битовой скорости Х1, а наивысший индекс, указывающий на последнюю строку, дает набор параметров для самой низкой битовой скорости Хn.

Это обеспечивает возможность настройки, которая зависит от действующего набора режимов.

В конфигурации, представленной на фиг.4, целевое значение битовой скорости может быть реализовано способом замкнутого контура путем поочередной адаптации с использованием различных кодовых книг настройки до достижения желательного целевого значения битовой скорости.

Блок 21 настройки может использовать индекс в качестве указателя на параметры настройки блока 23 кодовой книги настройки. Индекс кодовой книги настройки может быть увеличен или уменьшен на основе разностей между результатами в блоке 26 оценки средней битовой скорости и целевого значения 22 битовой скорости.

Средняя битовая скорость может настраиваться непрерывно в пределах некоторого диапазона битовых скоростей. Целевое значение битовой скорости предпочтительно устанавливается на значение между самым низким и самым высоким режимами речевого кодека в действующем наборе речевых кодеков. Например, средняя битовая скорость может настраиваться непрерывно в диапазоне от 4,75 до 12,2 кб/с. Преимущество этого состоит в том, что нагрузка сети может настраиваться на максимальную пропускную способность, обеспечивающую максимальное качество речи для произвольного числа мобильных пользователей. Поэтому ухудшение качества речи может быть минимизировано или вообще исключено. Это может быть достигнуто даже при увеличении пропускной способности сети.

Как показано на фиг.2, блок 20 адаптации может также включать в себя дополнительные функции для выработки информации для алгоритма выбора режима. Например, к речевому сигналу могут быть применены такие функции, как нормализация уровня по подполосам, вычисление долговременного значения энергии, анализ содержания кадра и настройка на низкое пороговое значение энергии.

Изобретение также может применяться в приложениях передачи сообщений, где пространство памяти может заполняться оптимальным образом с максимальным качеством речи или с большей длиной сообщения. Приложение передачи сообщений может включать в себя такие приложения, как речевые сообщения в MMS (мультимедийный отправитель), где записываются, сохраняются и посылаются речь/музыка или другие аудиоданные.

В приложениях типа передачи сообщений пространство памяти может быть заполнено оптимальным образом за счет использования данного изобретения. Поэтому, если известен доступный объем памяти, сообщение может быть сохранено точно с тем же объемом потока данных. Поэтому для данного сообщения может быть достигнуто наивысшее качество речи. С другой стороны, если требуется, то может быть сохранено более длинное сообщение при более низком разрешении кодирования путем настройки целевого значения битовой скорости.

Вариант осуществления может быть применен для беспроводной связи как в сети радиосвязи, так и в базовой сети. Хотя возможно, что элемент сети радиосвязи или базовой сети не требует поддержки всех возможных режимов кодека. Например, в сети радиосвязи контроллер 14 сети радиосвязи может поддерживать только поднабор режимов кодека.

Также следует отметить, что описанное выше решение также может быть использовано для кодирования с масштабируемой скоростью, при котором битовая скорость может изменяться от кадра к кадру анализа на основе сигнала источника.

Вышеописанная управляемая источником адаптация скорости является расширением адаптивных многоскоростных речевых кодеков. Однако подобные принципы могут быть применены к любым другим многоскоростным кодекам.

Вариант осуществления изобретения может обеспечить речевой кодек, в котором средняя битовая скорость при активной речи может быть существенно сокращена. Более высокая пропускная способность может быть достигнута в сетях и в приложениях хранения при поддержании того же самого качества речи.

Следует отметить, что хотя варианты осуществления настоящего изобретения описаны по отношению к пользовательскому оборудованию, такому как мобильные станции, варианты осуществления настоящего изобретения применимы к любому другому подходящему типу передающих и/или принимающих узлов. Таким образом, хотя приведенные для примера варианты осуществления изобретения описывают кодирование и декодирование по отношению к пользовательскому оборудованию и сетевому объекту, настоящее изобретение может быть применено к любым другим типам элементов, связанных с системой связи, где это применимо.

Вариант осуществления настоящего изобретения описан в контексте систем широкополосного множественного доступа с кодовым разделением каналов. Данное изобретение также применимо к любым другим методам доступа, включая множественный доступ с временным разделением каналов, множественный доступ с частотным разделением каналов или множественный доступ с пространственным разделением, а также к гибридным методам на основе указанных методов доступа. Используемые системы связи могут устанавливать некоторое ограничение для характеристик основанной на источнике адаптации скорости. Например, в системе стандарта GSM режим кодека может изменяться только каждые 40 мс. Это ограничение означает, что в системах GSM режим может изменяться только для каждого второго речевого кадра. В другой системе может оказаться, что выбранный режим может быть только одним из соседних режимов в действующем наборе кодеков.

Следует отметить, что хотя выше описаны приведенные для примера варианты осуществления изобретения, различные изменения и модификации могут быть осуществлены в раскрытом решении без отклонения от объема настоящего изобретения, как это определено в формуле изобретения.

1. Способ многоскоростного кодирования в системе связи, заключающийся в том, что
обеспечивают кодер с набором настраиваемых параметров для использования при выборе режимов кодирования, причем каждый набор параметров настройки обеспечивает некоторую среднюю битовую скорость,
принимают целевое значение битовой скорости для кодирования сигнала кодером, причем это целевое значение битовой скорости имеет некоторое значение между минимальной и максимальной средней битовой скоростью кодера,
выбирают режим кодирования на основе целевого значения битовой скорости и наборов параметров настройки и
кодируют сигнал посредством использования выбранного режима кодирования.

2. Способ по п.1, содержащий этап изменения целевого значения битовой скорости в течение действующего соединения.

3. Способ по п.1 или 2, содержащий выбор параметров настройки на основе оценки средней битовой скорости и целевого значения битовой скорости.

4. Способ по п.1 или 2, в котором число возможных наборов параметров настройки меньше, чем число возможных целевых значений битовой скорости.

5. Способ по п.1 или 2, в котором каждый набор параметров настройки связан с предварительно определенными характеристиками источника сигнала.

6. Способ по п.1 или 2, содержащий установку параметров алгоритма выбора режима кодера на основе целевого значения битовой скорости.

7. Способ по п.6, содержащий установку пороговых значений для выбора в алгоритме выбора режима на основе целевого значения битовой скорости.

8. Способ по п.1 или 2, содержащий функционирование кодера таким образом, что средняя битовая скорость кодера устанавливается на целевую битовую скорость.

9. Способ по п.8, содержащий формирование средней битовой скорости путем перехода между, по меньшей мере, двумя режимами различных фиксированных битовых скоростей в соответствии с, по меньшей мере, одним набором параметров настройки.

10. Способ по п.1 или 2, в котором выбор режима выполняется посредством контура, образованного функцией оценки средней битовой скорости, функцией настройки целевого значения битовой скорости, источником параметров настройки и алгоритмом выбора режима.

11. Способ по п.1 или 2, в котором этап выбора режима кодирования включает в себя адаптивный переход между различными наборами параметров настройки, определенными для различных целевых значений битовой скорости.

12. Способ по п.1 или 2, содержащий увеличение или уменьшение значения индекса кодовой книги настройки на основе определенных разностей между результатами оценки средней битовой скорости и целевой битовой скорости.

13. Способ по п.1 или 2, содержащий настройку средней битовой скорости кодера непрерывно посредством целевого значения битовой скорости в пределах предварительно определенного диапазона битовых скоростей.

14. Способ по п.1 или 2, содержащий использование дополнительной информации при выборе режима кодирования в дополнение к целевому значению битовой скорости.

15. Способ по п.14, содержащий использование информации, по меньшей мере, одного из нормализации подуровней, вычисления долгосрочного значения энергии, анализа содержания кадра и настройки низкого порогового значения.

16. Способ по п.1 или 2, в котором сигнал представляет собой аудиосигнал.

17. Устройство многоскоростного кодирования, содержащее кодер для кодирования сигналов,
источник для обеспечения набора параметров настройки, причем каждый набор параметров настройки обеспечивает некоторую среднюю битовую скорость,
вход для подачи целевого значения битовой скорости, причем это целевое значение битовой скорости имеет некоторое значение между минимальной и максимальной средней битовой скоростью кодера, и
селектор для выбора режима кодирования из набора режимов кодирования на основе целевого значения битовой скорости и наборов параметров настройки, при этом кодер выполнен с возможностью кодирования сигналов посредством использования режима кодирования, выбранного селектором.

18. Устройство многоскоростного кодирования по п.17, в котором кодер выполнен с возможностью приема нового целевого значения битовой скорости в течение действующей передачи и кодирования сигнала передачи на основе различных режимов кодирования в соответствии с выбором, осуществленным селектором.

19. Устройство многоскоростного кодирования по п.17 или 18, в котором источник содержит память, интегрированную с кодером, для хранения наборов параметров настройки.

20. Устройство многоскоростного кодирования по п.17 или 18, в котором кодер содержит средство оценки средней битовой скорости, при этом селектор выполнен с возможностью выбора параметров настройки на основе оценки средней битовой скорости, набора параметров настройки и целевого значения битовой скорости.

21. Устройство многоскоростного кодирования по п.17 или 18, в котором кодер содержит контур, образованный средством оценки средней битовой скорости, функцией настройки целевого значения битовой скорости, источником параметров настройки и алгоритмом выбора режима.

22. Устройство многоскоростного кодирования по п.17 или 18, в котором селектор выполнен с возможностью адаптивного перехода между различными наборами параметров настройки, определенных для различных целевых значений битовой скорости.

23. Устройство многоскоростного кодирования по п.17 или 18, выполненное с возможностью формирования средней битовой скорости путем перехода между, по меньшей мере, двумя различными режимами фиксированных битовых скоростей в соответствии с набором параметров настройки.

24. Система связи, содержащая передающий узел, снабженный кодером для кодирования сигналов, и приемный узел, снабженный декодером для декодирования сигналов от передающего узла, причем система содержит
память для хранения наборов параметров настройки, причем каждый набор параметров настройки обеспечивает некоторую среднюю битовую скорость,
вход для подачи целевого значения битовой скорости, причем это целевое значение битовой скорости имеет некоторое значение между минимальной и максимальной средней битовой скоростью кодера, и
селектор для выбора режима кодирования из набора режимов кодирования на основе целевого значения битовой скорости и наборов параметров настройки, при этом кодер выполнен с возможностью кодирования сигналов посредством использования режима кодирования, выбранного селектором.



 

Похожие патенты:

Изобретение относится к обработке многоканального аудио и, в частности, к многоканальному кодированию и синтезу с использованием параметрической дополнительной информации.

Изобретение относится к способу декодирования сигнала, который кодирован посредством гибридного кодера. .

Изобретение относится к кодированию с предсказанием информационных сигналов, например аудиосигналов, в частности к адаптивному кодированию с предсказанием. .

Изобретение относится к кодированию аудиосигналов потоками аудиоданных. .

Изобретение относится к цифровому кодированию звуковых сигналов. .

Изобретение относится к способу и устройству для последующей обработки декодированного звукового сигнала, причем декодированный звуковой сигнал делят на совокупность сигналов частотных поддиапазонов и последующую обработку применяют к, по меньшей мере, одному из совокупности сигналов частотных поддиапазонов.

Изобретение относится к способу и устройству для квантования параметров линейного предсказания в кодировании звукового сигнала с переменной битовой скоростью, при котором принимают входной вектор параметров линейного предсказания, классифицируют кадр звукового сигнала, соответствующий входному вектору параметров линейного предсказания, вычисляют вектор предсказания, вычисленный вектор предсказания удаляют из входного вектора параметров линейного предсказания для создания вектора ошибки предсказания, и вектор ошибки предсказания квантуют.

Изобретение относится к кодированию сигнала, в частности звукового сигнала. .

Изобретение относится к анализу и синтезу речевой информации, выводимой из ЭВМ. .

Изобретение относится к передаче речи, в частности, к способу изменения масштаба времени вокодерных кадров в вокодере

Изобретение относится к системам кодирования сигнала (100)

Изобретение относится к беспроводным системам связи, более конкретно, варианты осуществления изобретения имеют отношение к созданию и использованию кодовых книг на основе унитарных матриц

Изобретение относится к кодированию речи и более конкретно к проблеме разреженности в кодированных речевых сигналах

Изобретение относится к области кодирования аудиосигнала низкой скорости передачи битов высокого качества

Изобретение относится к способу и устройству для обработки звукового сигнала

Изобретение относится к декодированию сжатой цифровой информации, в частности к декодированию битовых потоков, отражающих контент, который сжат с применением методов кодирования с долговременным предсказанием

Изобретение относится к трансформации шкалы времени, т.е
Наверх