Способ и устройство, предназначенные для эффективной передачи сигналов размерности и пачки в полосе частот и работы с максимальной половинной скоростью при широкополосном кодировании речи с переменной скоростью передачи битов для беспроводных систем мдкр

Изобретение относится к радиосвязи и предназначено для взаимодействия первой станции со второй станцией. Технический результат - повышение достоверности передачи. Для этого первая станция использует первую схему связи и содержит первый кодер и первый декодер, а вторая станция использует вторую схему связи и содержит второй кодер и второй декодер, связь между первой и второй станциями осуществляют с помощью передачи параметров кодирования сигнала, связанных со звуковым сигналом, из кодера одной из станций первой или второй в декодер другой станции. Звуковой сигнал классифицируют для определения, должны ли быть переданы параметры кодирования сигнала из кодера одной станции в декодер другой станции с использованием первого режима связи, в котором используется полная скорость передачи для передачи параметров кодирования сигнала. Если классификация звукового сигнала определит, что параметры кодирования сигнала должны быть переданы с использованием первого режима связи, и, если принят запрос для передачи параметров кодирования сигнала из кодера одной станции в декодер другой станции с использованием второго режима связи, предназначенного для уменьшения скорости передачи во время передачи параметров кодирования сигнала, часть параметров кодирования сигнала из кодера одной станции удаляют, а остальные параметры кодирования сигнала передают в декодер другой станции с использованием второго режима связи. Удаленную часть параметров кодирования сигнала регенерируют перед тем, как декодер другой станции декодирует параметры кодирования сигнала. 24 н. и 38 з.п. ф-лы, 8 ил., 6 табл.

 

Область техники, к которой относится изобретение

Настоящее изобретение относится к способу, предназначенному для взаимодействия первой станции, использующей первую схему связи и содержащей первый кодер и первый декодер, со второй станцией, использующей вторую схему связи и содержащей второй кодер и второй декодер, причем связь между первой и второй станциями проводится с помощью передачи параметров кодирования сигнала из кодера одной из станций первой или второй в декодер другой из упомянутых первой и второй станций.

Уровень техники

Требование эффективных способов цифрового узкополосного и широкополосного кодирования речи с хорошим компромиссом между субъективным качеством и скоростью передачи увеличивается в различных областях применений, таких как проведение телеконференций, передача мультимедиа и беспроводная связь. До сих пор телефонная полоса частот, ограниченная в диапазоне 200-3400 Гц, в основном используется в применениях кодирования речи. Однако широкополосные применения речи обеспечивают увеличенную разборчивость и естественность в связи по сравнению с традиционной телефонной полосой частот. Полоса частот в диапазоне 50-7000 Гц обнаружена достаточной для передачи хорошего качества, создавая впечатление личной связи. Для обычных аудиосигналов эта полоса частот дает приемлемое субъективное качество, но, все же, ниже, чем качество радио FM или CD, которые работают в диапазонах 20-16000 Гц и 20-20000 Гц соответственно.

Кодер речи преобразует речевой сигнал в цифровой битовый поток, который передается через канал связи или запоминается на носителе информации. Речевой сигнал преобразуется в цифровую форму, то есть подвергается выборке и квантуется, обычно с частотой 16 битов на выборку. Кодер речи имеет функцию представления этих цифровых выборок с помощью меньшего числа бит, в то же время поддерживая хорошее субъективное качество речи. Декодер или синтезатор речи работает относительно переданного или запомненного битового потока и преобразует его обратно в речевой сигнал.

Кодирование с линейным предсказанием с кодовым возбуждением (CELP, ЛПКВ) является одним из самых лучших способов предшествующего уровня техники для достижения хорошего компромисса между субъективным качеством и скоростью передачи. Этот способ кодирования составляет основу нескольких стандартов кодирования речи как в беспроводных, так и в проводных применениях. При кодировании ЛПКВ выборочный сигнал обрабатывается в последовательных блоках из N выборок, обычно называемых кадрами, где N является заданным числом, обычно соответствующим 10-30 мс. Фильтр линейного предсказания (LP, ЛП) вычисляется и передается каждый кадр. Вычисление фильтра ЛП обычно требует просмотра вперед, т.е. речевого сегмента 5-15 мс от следующего кадра. Кадр из N выборок разделяется на меньшие блоки, называемые подкадрами. Обычно число подкадров в кадре равно трем (3) или четырем (4), в результате получаются подкадры 4-10 мс. В каждом подкадре сигнал возбуждения обычно получается из двух составляющих, прошлое возбуждение и новое возбуждение фиксированной кодовой книги. Составляющая, сформированная из прошлого возбуждения, часто называется возбуждением адаптивной кодовой книги или основного тона. Параметры, характеризующие сигнал возбуждения, кодируются и передаются в декодер, где восстановленный сигнал возбуждения используется в качестве входного сигнала фильтра ЛП.

В беспроводных системах, использующих технологию множественного доступа с кодовым разделением каналов (CDMA, МДКР), использование кодирования речи с управляемой источником переменной скоростью передачи (VBR, ПерСП) существенно улучшает пропускную способность системы. При кодировании с управляемой источником ПерСП кодек работает с несколькими скоростями передачи битов, и модуль выбора скорости передачи используется для выбора скорости передачи битов, используемой для кодирования каждого речевого кадра, на основании характера речевого кадра (например, звонкий (вокализированный), незвонкий (невокализированный, переходный, фоновый шум и т.д.). Целью является добиться наилучшего качества речи при данной средней скорости передачи битов, также называемой средней скоростью передачи данных (ADR, ССПД). Кодек может работать в разных режимах с помощью настройки модуля выбора скорости передачи, чтобы добиться разных ССПД в разных режимах, причем производительность кодека улучшается с увеличением ССПД. Это обеспечивает кодек механизмом компромисса между качеством речи и пропускной способностью системы. В системах МДКР (например, CDMA-one и CDMA2000) обычно используются 4 скорости передачи битов, и они называются полной скоростью передачи (FR, ПолнСП), половинной скоростью передачи (HR, ПолСП), одной четвертой скорости передачи (QR, ОЧСП) и одной восьмой скорости передачи (ER, ОВСП). В этой системе поддерживаются два множества скоростей, называемые множеством I скорости и множеством II скорости. В множестве II скорости кодек с переменной скоростью передачи с механизмом выбора скорости передачи работает со скоростями кодирования источника, равными 13,3 (ПолнСП), 6,2 (ПолСП), 2,7 (ОЧСП) и 1,0 (ОВСП) Кбит/с, соответствующими совокупным скоростям передачи битов, равным 14,4, 7,2, 3,6 и 1,8 Кбит/с (с некоторыми битами, добавленными для обнаружения ошибок).

В системах МДКР может быть навязана половинная скорость передачи вместо полной скорости передачи в некоторых речевых кадрах для того, чтобы посылать сигнальную информацию в полосе частот (называемую передачей сигналов размерности и пачки). Использование половинной скорости передачи в качестве максимальной скорости передачи также может быть навязано системой во время плохих состояний канала (таких как вблизи границ ячеек) для того, чтобы улучшить надежность кодека. Это называется максимальной половинной скоростью передачи. Обычно при кодировании с ПерСП половинная скорость используется, когда кадр является постоянно звонким или постоянно незвонким. Две конструкции кодека используются для каждого типа сигнала (в случае незвонкого сигнала используется модель ЛПКВ без кодовой книги основного тона, а в случае звонкой речи используется модификация сигнала, чтобы улучшить периодичность и уменьшить число битов для индексов основного тона). Полная скорость используется для начальных, переходных кадров и смешанных звонких кадров (обычно используется типичная модель ЛПКВ). Когда модуль выбора скорости выбирает кадр, кодируемый как кадр с полной скоростью передачи, а система навязывает кадр с половинной скоростью передачи, эффективность речи ухудшается, поскольку режимы с половинной скоростью передачи не могут эффективно кодировать начальные и переходные сигналы.

Широкополосный кодек, известный как адаптивный многоскоростной широкополосный (AMR-WB, АМ-Ш) кодек речи, недавно был выбран организацией ITU-T (Международный союз электросвязи - сектор стандартизации электросвязи) для нескольких услуг широкополосной телефонии и услуг передачи речи, а организацией 3GPP (Проект партнерства третьего поколения) для беспроводных систем третьего поколения GSM и W-CDMA, Ш-МДКР. Кодек АМ-Ш содержит девять скоростей передачи битов в диапазоне от 6,6 до 23,85 Кбит/с. Разработка кодека ПерСП, управляемого источником, на основе АМ-Ш для СDMA2000 имеет преимущество в предоставлении возможности взаимодействия между CDMA2000 и другими системами, использующими кодек АМ-Ш. Скорость передачи битов АМ-Ш 12,65 Кбит/с является ближайшей скоростью, которая подходит к полной скорости 13,3 Кбит/с множества II скорости. Эта скорость может быть использована в качестве общей скорости между широкополосным кодеком ПерСП CDMA2000 и АМ-Ш, чтобы обеспечить возможность функциональной совместимости без необходимости в преобразовании кодирования (которое ухудшает качество речи). Половинная скорость 6,2 Кбит/с должна быть добавлена к широкополосному решению ПерСП CDMA2000, чтобы обеспечить возможность эффективной работы в рамках множества II скорости. Тогда кодек может работать в нескольких специфических режимах CDMA2000 и содержит режим, предназначенный для обеспечения возможности функциональной совместимости с системами, использующими кодек АМ-Ш. Однако при работе кросс-системы без последовательного соединения каналов вызов между CDMA2000 и другой системой, использующей АМ-Ш, система CDMA2000 может навязать использование половинной скорости передачи, как объяснено ранее (такое как при передаче сигналов размерности и пачки). Поскольку кодек АМ-Ш не распознает половинную скорость 6,2 Кбит/с широкополосного кодека CDMA2000, навязанные кадры с половинной скоростью передачи интерпретируются как стертые кадры. Это отрицательно влияет на эффективность соединения.

Сущность изобретения

В соответствии с первым аспектом настоящего изобретения предложены следующие способ и система.

Способ взаимодействия первой станции, использующей первую схему связи и содержащей первый кодер и первый декодер, со второй станцией, использующей вторую схему связи и содержащей второй кодер и второй декодер, причем связь между первой и второй станциями осуществляют с помощью передачи параметров кодирования сигнала из кодера одной из станций первой или второй в декодер другой из упомянутых первой и второй станций, заключающийся в том, что принимают запрос для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию с использованием режима связи, предназначенного для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала; в ответ на запрос удаляют часть параметров кодирования сигнала из кодера упомянутой одной станции и передают в декодер другой станции остальные параметры кодирования сигнала; и регенерируют часть параметров кодирования сигнала и декодируют в декодере другой станции параметры кодирования сигнала.

Система для взаимодействия первой станции, использующей первую схему связи и содержащей первый кодер и первый декодер, со второй станцией, использующей вторую схему связи и содержащей второй кодер и второй декодер, причем связь между первой и второй станциями осуществляется с помощью передачи параметров кодирования сигнала из кодера одной из станций первой или второй в декодер другой из упомянутых первой и второй станций, содержащая средство, предназначенное для приема запроса для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию с использованием режима связи, предназначенного для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала; средство, предназначенное для удаления в ответ на запрос части параметров кодирования сигнала из кодера упомянутой одной станции и передачи в декодер другой станции остальных параметров кодирования сигнала; и средство, предназначенное для регенерации части параметров кодирования сигнала, и декодер другой станции, предназначенный для декодирования параметров кодирования сигнала.

В соответствии со вторым аспектом настоящего изобретения предложены следующие способ и система.

Способ взаимодействия первой станции, использующей первую схему связи и содержащей первый кодер и первый декодер, со второй станцией, использующей вторую схему связи и содержащей второй кодер и второй декодер, причем связь между первой и второй станциями осуществляют с помощью передачи параметров кодирования сигнала, связанных со звуковым сигналом, из кодера одной из станций первой или второй в декодер другой из упомянутых первой и второй станций, заключающийся в том, что классифицируют звуковой сигнал для определения, должны ли быть переданы параметры кодирования сигнала из кодера упомянутой одной станции в декодер другой станции с использованием первого режима связи, в котором используют полную скорость передачи битов для передачи параметров кодирования сигнала; принимают запрос для передачи параметров кодирования сигнала из кодера упомянутой одной станции в декодер другой станции с использованием второго режима связи, предназначенного для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала, если классификация звукового сигнала определяет, что параметры кодирования сигнала должны быть переданы с использованием первого режима связи, и если принят запрос для передачи параметров кодирования сигнала с использованием второго режима связи, удаляют часть параметров кодирования сигнала из кодера упомянутой одной станции и передают в декодер другой станции остальные параметры кодирования сигнала с использованием второго режима связи.

Система для взаимодействия первой станции, использующей первую схему связи и содержащей первый кодер и первый декодер, со второй станцией, использующей вторую схему связи и содержащей второй кодер и второй декодер, причем связь между первой и второй станциями осуществляется с помощью передачи параметров кодирования сигнала, связанных со звуковым сигналом, из кодера одной из станций первой или второй в декодер другой из упомянутых первой и второй станций, содержащая средство, предназначенное для классификации звукового сигнала для определения, должны ли быть переданы параметры кодирования сигнала из кодера упомянутой одной станции в декодер другой станции с использованием первого режима связи, в котором используется полная скорость передачи битов для передачи параметров кодирования сигнала; средство, предназначенное для приема запроса для передачи параметров кодирования сигнала из кодера упомянутой одной станции в декодер другой станции с использованием второго режима связи, предназначенного для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала; средство, предназначенное для удаления части параметров кодирования сигнала из кодера упомянутой одной станции и передачи в декодер другой станции остальных параметров кодирования сигнала с использованием второго режима связи, если классификация звукового сигнала определяет, что параметры кодирования сигнала должны быть переданы с использованием первого режима связи, и если принят запрос для передачи параметров кодирования сигнала с использованием второго режима связи.

В соответствии с третьим аспектом настоящего изобретения предложены следующие способ и система.

Способ передачи параметров кодирования сигнала из первой станции во вторую станцию, заключающийся в том, что в одной из станций первой или второй кодируют звуковой сигнал в соответствии с режимом связи с полной скоростью передачи; принимают запрос для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию из первой и второй станций с использованием второго режима связи, предназначенного для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала; в ответ на запрос преобразуют параметры кодирования сигнала, закодированные в режиме связи с полной скоростью передачи, в параметры кодирования сигнала, закодированные во втором режиме связи; и передают параметры кодирования сигнала, закодированные во втором режиме связи, в другую станцию из первой и второй станций.

Система для передачи параметров кодирования сигнала из первой станции во вторую станцию, содержащая в одной из станций первой или второй кодер, предназначенный для кодирования звукового сигнала в соответствии с режимом связи с полной скоростью передачи; средство, предназначенное для приема запроса для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию из первой и второй станций с использованием второго режима связи, предназначенного для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала; средство, предназначенное для преобразования, в ответ на запрос, параметров кодирования сигнала, закодированных в режиме связи с полной скоростью передачи, в параметры кодирования сигнала, закодированные во втором режиме связи; и средство, предназначенное для передачи параметров кодирования сигнала, закодированных во втором режиме связи, в другую станцию из первой и второй станций.

Вышеупомянутые и другие задачи, преимущества и признаки настоящего изобретения станут более понятными после чтения следующего неограничительного описания его иллюстративных вариантов осуществления, приведенных только в качестве примера, со ссылкой на сопровождающие чертежи.

Краткое описание чертежей

Фиг.1 представляет схематическую блок-схему неограничительного примера системы передачи речи, в которой может быть использовано настоящее изобретение;

фиг.2 представляет функциональную блок-схему неограничительного примера кодека с переменной скоростью передачи, содержащего логические схемы определения скорости;

фиг.3 представляет функциональную блок-схему неограничительного примера кодека с переменной скоростью передачи, включающего в себя логические схемы определения скорости, использующие общую ПолСП для кадров низкой мощности;

фиг.4 представляет функциональную блок-схему неограничительного примера кодека с переменной скоростью передачи в соответствии с фиг.3, включающего в себя системный запрос половинной скорости передачи в логических схемах определения скорости;

фиг.5 представляет функциональную блок-схему примера кодека с переменной скоростью передачи в соответствии с неограничительным иллюстративным вариантом осуществления настоящего изобретения, включающего в себя системный запрос половинной скорости передачи на пакетном уровне (или уровне битового потока) в логических схемах определения скорости;

фиг.6 представляет пример конфигурации для способа передачи сигналов размерности и пачки в соответствии с неограничительным иллюстративным вариантом осуществления настоящего изобретения в функционально совместимом режиме VBR-WB, Ш-ПерСП при участии в вызове между мобильной станцией и мобильной станцией 3GPP - CDMA2000 или в вызове IP АМ-Ш - Ш-ПерСП;

фиг.7 представляет схематическую блок-схему неограничительного примера широкополосного устройства кодирования, более конкретно кодера АМ-Ш; и

фиг.8 представляет схематическую блок-схему неограничительного примера широкополосного устройства декодирования, более конкретно декодера АМ-Ш.

Подробное описание иллюстративного варианта осуществления

Несмотря на то, что иллюстративный вариант осуществления настоящего изобретения будет описан в следующем описании в связи с речевым сигналом, следует иметь в виду, что концепции настоящего изобретения также применяются к другим типам сигналов, в частности, но не исключительно, к другим типам звуковых сигналов.

Фиг.1 иллюстрирует систему 100 передачи речи, изображающую использование устройств кодирования и декодирования речи. Система 100 передачи речи фиг.1 поддерживает передачу речевых сигналов через канал 101 связи. Несмотря на то, что он может содержать, например, проводную, оптическую линию связи или волоконно-оптическую линию связи, канал 101 связи обычно содержит, по меньшей мере, частично радиочастотную линию связи. Радиочастотная линия связи часто поддерживает множество одновременных передач речи, требующих совместно используемых ресурсов полосы частот, таких, которые могут быть обнаружены с помощью систем сотовой телефонии. Несмотря на то, что это не изображено, канал 101 связи может быть заменен запоминающим устройством в одной реализации устройства системы 100, которое записывает и запоминает закодированный речевой сигнал для последующего воспроизведения.

В системе 100 передачи речи фиг.1 микрофон 102 создает аналоговый речевой сигнал 103, который подается в аналого-цифровой (A/D, А/Ц) преобразователь 104 для преобразования его в цифровой речевой сигнал 105. Кодер 106 речи кодирует цифровой сигнал 105 для создания множества параметров 107 кодирования сигнала, которые кодируют в двоичном виде и передают в кодер 108 канала. Необязательный кодер 108 канала добавляет избыточность к двоичному представлению параметров 107 кодирования сигнала перед передачей их через канал 101 связи.

В приемнике декодер 109 канала использует избыточную информацию в принятом битовом потоке 111 для обнаружения и исправления ошибок канала, которые появились во время передачи. Декодер 110 речи преобразует битовый поток 112, принятый из декодера 109 канала, обратно в множество параметров кодирования сигнала и создает из восстановленных параметров кодирования сигнала цифровой синтезированный речевой сигнал 113. Цифровой синтезированный речевой сигнал 113, восстановленный в декодере 110 речи, преобразуется в аналоговую форму 114 с помощью цифроаналогового (D/А, Ц/А) преобразователя 115 и воспроизводится через устройство 116 громкоговорителя.

Кодирование речи с переменной скоростью передачи, управляемое источником

Фиг.2 изображает неограничительный пример конфигурации кодека с переменной скоростью передачи, включающей в себя логическую схему определения, предназначенную для управления четырьмя скоростями кодирования. В этом примере множество скоростей передачи битов содержит назначенную скорость передачи битов кодека для неактивных речевых кадров (модуль 208 кодирования одной восьмой скорости передачи (CNG, ГКШ)), скорость передачи битов для незвонких речевых кадров (модуль 207 кодирования половинной скорости передачи незвонких кадров), скорость передачи для стабильных звонких кадров (модуль 206 кодирования половинной скорости передачи звонких кадров) и скорость передачи битов для других типов кадров (модуль 205 кодирования полной скорости).

Логические схемы определения скорости основаны на классификации сигнала, выполняемого на трех этапах (201, 202 и 203) на основании кадра, работа которых хорошо известна обычным специалистам в данной области техники.

Сначала детектор речевой активности (VAD, ДРА) разделяет неактивные и активные речевые кадры. Если обнаружен неактивный речевой кадр (фоновый сигнал шума), тогда цепочка классификации сигнала заканчивается, и кадр кодируется в модуле 208 кодирования как кадр с одной восьмой скорости с помощью генератора комфортного шума (CNG, ГКШ) в декодере (1,0 Кбит/с в соответствии с множеством II скорости CDMA2000). Если обнаружен активный кадр, кадр подлежит второй классификации.

Второй классификатор 202 назначен для принятия решения относительно звучания. Если классификатор 202 классифицирует кадр как незвонкий речевой кадр, цепочка классификации заканчивается, и кадр кодируется в модуле 207 с половинной скоростью, оптимизированной для незвонких сигналов (6,2 Кбит/с в соответствии с множеством II скорости CDMA2000). В противном случае речевой кадр обрабатывается посредством "стабильного звонкого" классификатора 203.

Если кадр классифицирован как стабильный звонкий кадр, тогда кадр кодируется в модуле 206 с половинной скоростью, оптимизированной для стабильных звонких сигналов (6,2 Кбит/с в соответствии с множеством II скорости CDMA2000). В противном случае кадр, вероятно, должен содержать нестационарный речевой сегмент, такой как звонкий начальный речевой сигнал или быстро изменяющийся звонкий речевой сигнал. Эти кадры обычно требуют высокую скорость передачи для поддержания хорошего субъективного качества. Следовательно, в этом случае речевой кадр кодируется в модуле 205 как кадр с полной скоростью передачи (13,3 Кбит/с в соответствии с множеством II скорости CDMA2000).

В неограничительной альтернативной реализации, изображенной на фиг.2, если кадр не классифицирован как "стабильный звонкий", он обрабатывается посредством классификатора 311 кадров низкой энергии. Это используется для того, чтобы обнаружить кадры, не учтенные детектором 201 ДРА. Если энергия кадра ниже определенного порога, кадр кодируется с использованием кодера 312 общей половинной скорости, в противном случае кадр кодируется в модуле 205 как кадр с полной скоростью передачи.

Модули 201, 202, 203 и 311 классификации сигнала хорошо известны обычным специалистам в данной области техники и, таким образом, не будут дополнительно описаны в настоящем описании. В неограничительном примере фиг.3 модули кодирования с разными скоростями передачи, а именно модули 205, 206, 207, 208 и 312, основаны на способах кодирования с линейным предсказанием с кодовым возбуждением (ЛПКВ), также хорошо известных обычным специалистам в данной области техники. Например, скорости передачи установлены в соответствии с множеством II скорости системы CDMA2000, описанной в настоящем описании выше.

Неограничительный иллюстративный вариант осуществления настоящего изобретения описан в настоящей заявке со ссылкой на широкополосный кодек речи, который стандартизован международным союзом электросвязи (ITU) в качестве Рекомендации G.722.2 и известен как кодек АМ-Ш (адаптивный многоскоростной широкополосный кодек) [ITU Recommendation G.722.2 "Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)", Geneva, 2002]. Этот кодек также выбран Проектом партнерства третьего поколения (3GPP) для широкополосной телефонии в беспроводных системах третьего поколения [3GPP TS 26.190, "AMR Wideband Speech Codec: Transcoding Functions", 3GPP Technical Specification]. АМ-Ш может работать с 9 скоростями передачи от 6,6 до 23,85 Кбит/с. В настоящем описании используется скорость передачи 12,65 Кбит/с в качестве примера полной скорости.

Конечно, неограничительный иллюстративный вариант осуществления настоящего изобретения мог бы быть применен к другим типам кодеков.

Ради удобства читателя ниже в настоящем описании приведен обзор кодека АМ-Ш.

Обзор кодера АМ-Ш

Ссылаясь на фиг.7, выборочный речевой сигнал кодируется последовательно блок за блоком с помощью устройства 700 кодирования фиг.7, которое разбито на одиннадцать модулей, пронумерованных от 701 до 711.

Следовательно, входной речевой сигнал 712 обрабатывается последовательно блок за блоком, т. е. в упомянутых выше блоках L выборок, называемых кадрами.

Ссылаясь на фиг.7, выборочный входной речевой сигнал 712 подвергается выборке с понижением частоты в модуле 701 устройства выборки. Сигнал подвергается выборке с понижением частоты от 16 кГц до 12,8 кГц с использованием способов, хорошо известных обычным специалистам в данной области техники. Выполнение выборки с понижением частоты увеличивает эффективность кодирования, поскольку кодируется меньшая ширина полосы частот. Это также уменьшает алгоритмическую сложность, поскольку уменьшается число выборок в кадре. После выполнения дискретизации с понижением частоты кадр из 320 выборок 20 мс уменьшается до кадра из 256 выборок (коэффициент выполнения дискретизации с понижением частоты 4/5).

Затем входной кадр подается в необязательный модуль 702 предварительной обработки. Модуль 702 предварительной обработки может состоять из фильтра верхних частот с частотой отсечки 50 Гц. Фильтр 702 верхних частот удаляет нежелательные звуковые составляющие ниже 50 Гц.

Дискретизированный с понижением частоты предварительно обработанный сигнал обозначен с помощью Sp(n), n=0,1,2,...,L-1, где L - длина кадра (256 при частоте дискретизации 12,8 кГц). Этот сигнал Sp(n) предварительно выделяется с использованием фильтра 703 предварительного выделения, имеющего следующую передаточную функцию:

P(z)=1-μz-1,

где μ - коэффициент предварительного выделения с величиной, находящейся между 0 и 1 (типичная величина равна μ=0,7). Функцией фильтра 703 предварительного выделения является увеличение высокочастотных составляющих входного речевого сигнала. Он также уменьшает динамический диапазон входного речевого сигнала, что делает его более подходящим для реализации с фиксированной запятой. Предварительное выделение также играет важную роль в выполнении соответствующего взвешивания общего восприятия ошибки квантования, что способствует улучшенному качеству звука.

Выходной сигнал фильтра 703 предварительного выделения обозначен s(n). Этот сигнал используется для выполнения анализа ЛП в модуле 704. Анализ ЛП является способом, хорошо известным обычным специалистам в данной области техники. В примере фиг.7 используется подход автокорреляции. В подходе автокорреляции сигнал s(n) сначала стробируется обычно с использованием окна Хэмминга, имеющего длительность порядка 30-40 мс. Автокорреляция вычисляется из стробированного сигнала и используется рекурсия Левинсона-Дурбина для вычисления коэффициентов фильтра ЛП, ai, где i=1,...,p и где p - порядок ЛП, который обычно равен 16 при широкополосном кодировании. Параметры ai являются коэффициентами передаточной функции A(z) фильтра ЛП, которая задается следующей зависимостью:

Анализ ЛП выполняется в модуле 704, который также выполняет квантование и интерполяцию коэффициентов фильтра ЛП. Коэффициенты фильтра ЛП сначала преобразуются в другую эквивалентную область, более подходящую для целей квантования и интерполяции. Области линейной спектральной пары (LSP, ЛСП) и спектральной пары иммитанса (ISP, СПИ) являются двумя областями, в которых может быть эффективно выполнено квантование и интерполяция. 16 коэффициентов фильтра ЛР ai могут быть квантованы с помощью числа бит порядка 30-50 бит с использованием раздельного или многоэтапного квантования или их комбинации. Целью интерполяции является дать возможность обновления коэффициентов фильтра ЛП в каждом подкадре, в то же время передавая их один раз в каждом кадре, что улучшает эффективность кодера, не увеличивая скорость передачи. Предполагается, что квантование и интерполяция коэффициентов фильтра ЛП в других отношениях хорошо знакомы обычным специалистам в данной области техники и, таким образом, не будут дополнительно описаны в настоящем описании.

Следующие параграфы будут описывать остальные операции кодирования, выполняемые на основе подкадров. Входной кадр разделяется на 4 подкадра, равные 5 мс (64 выборки с частотой дискретизации, равной 12,8 кГц). В следующем описании фильтр A(z) обозначает неквантованный интерполированный фильтр ЛП подкадра, а фильтр В(z) обозначает квантованный интерполированный фильтр ЛП подкадра. Фильтр В(z) подает каждый подкадр в мультиплексор 713 для передачи через канал связи.

В кодерах анализа с помощью синтеза поиск оптимального основного тона и новых параметров выполняется с помощью минимизации среднеквадратичной ошибки между входным речевым сигналом 712 и синтезированным речевым сигналом в области взвешенного восприятия. Взвешенный сигнал Sw(n) вычисляется в фильтре 705 взвешивания восприятия в ответ на сигнал S(n) из фильтра 703 предварительного выделения. Используется фильтр 705 взвешивания восприятия с фиксированным знаменателем, подходящий для широкополосных сигналов. Пример передаточной функции для фильтра 705 взвешивания восприятия задается следующей зависимостью:

W(z)=A(z/y1)/(1-y2z-1), где 0<y2<y1≤1

Для того чтобы упростить анализ основного тона, сначала оценивается задержка TOL основного тона с открытым контуром в модуле 706 поиска основного тона с открытым контуром из взвешенного речевого сигнала Sw(n). Затем анализ основного тона с замкнутым контуром, который выполняется в модуле 707 поиска основного тона с замкнутым контуром на основе подкадров, ограничивается около задержки TOL основного тона с открытым контуром, что существенно уменьшает сложность параметров T (задержка основного тона) и b (усиление основного тона) LTP, ДП (долгосрочное предсказание). Анализ основного тона с открытым контуром обычно выполняется в модуле 706 один раз каждые 10 мс (два подкадра) с использованием способов, хорошо известных обычным специалистам в данной области техники.

Сначала вычисляется вектор x цели для ДП (долгосрочного предсказания). Это обычно выполняется с помощью вычитания нулевого входного отклика s0 взвешенного фильтра синтеза W(z)/В(z) из взвешенного речевого сигнала sw(n). Этот нулевой входной отклик s0 вычисляют с помощью устройства 708 вычисления нулевого входного отклика в ответ на фильтр ЛП квантованной интерполяции В(z) из анализа ЛП, модуля 704 квантования и интерполяции и на начальные состояния взвешенного фильтра синтеза W(z)/В(z), хранимого в модуле 711 обновления памяти, в ответ на фильтры НЧ A(z) и В(z) и вектор u возбуждения. Эта операция хорошо известна обычным специалистам в данной области техники и, таким образом, не будет дополнительно описана.

Вектор h импульсного отклика размерности N взвешенного фильтра синтеза W(z)/В(z) вычисляется в генераторе 709 импульсного отклика с использованием коэффициентов фильтра ЛП A(Z) и В(z) из модуля 704. Опять эта операция хорошо известна обычным специалистам в данной области техники и, таким образом, не будет дополнительно описана в настоящем описании.

Параметры b, T и j основного тона с замкнутым контуром (или кодовая книга основного тона) вычисляются в модуле 707 поиска основного тона с замкнутым контуром, который использует вектор x цели, вектор h импульсного отклика и задержку TOL основного тона с открытым контуром в качестве входных сигналов.

Поиск основного тона состоит в нахождении наилучшей задержки Т, которая минимизирует среднеквадратичную взвешенную ошибку предсказания основного тона, например,

е(j)=||x-b(j)y(j)||2, где j=1,2, ..., k

между вектором х цели и масштабированным отфильтрованным вариантом прошлого возбуждения by.

Более конкретно, поиск основного тона (кодовой книги основного тона) состоит из трех этапов.

На первом этапе оценивается задержка TOL основного тона с открытым контуром в модуле 706 поиска основного тона с открытым контуром в ответ на взвешенный речевой сигнал sw(n). Как указано в приведенном выше описании, этот анализ с открытым контуром обычно выполняется один раз каждые 10 мс (два подкадра) с использованием способов, хорошо известных обычным специалистам в данной области техники.

На втором этапе ищется критерий С поиска в модуле 707 поиска основного тона с замкнутым контуром для целых задержек основного тона около оцененной задержки TOL основного тона с открытым контуром (обычно +5), что существенно упрощает процедуру поиска. Простая процедура используется для обновления отфильтрованного кодового вектора yT (этот вектор определен в дальнейшем описании) без необходимости вычислять свертку для каждой задержки основного тона. Пример критерия С поиска задается с помощью

С=,

где t обозначает транспортирование вектора

Когда найдена оптимальная целая задержка основного тона на втором этапе, третий этап поиска (модуль 707) проверяет, посредством критерия С поиска, дробные части около оптимальной целой задержки основного тона. Например, стандарт АМ-Ш использует разрешение подвыборки 1/4 и 1/2.

В широкополосных сигналах структура гармоник существует только до определенной частоты, зависящей от речевого сегмента. Следовательно, для того чтобы достичь эффективного представления вклада основного тона в звонкие сегменты широкополосного речевого сигнала, необходима гибкость, чтобы изменять величину периодичности в широкополосном спектре. Это достигается с помощью обработки кодового вектора основного тона посредством множества частотных формирующих фильтров (например, фильтров нижних частот и полосовых фильтров). И выбирается частотный формирующий фильтр, который минимизирует определенную выше среднеквадратичную взвешенную ошибку е. Выбранный частотный формирующий фильтр идентифицируется с помощью индекса j.

Индекс Т кодовой книги основного тона кодируется и передается в мультиплексор 713 для передачи через канал связи. Коэффициент усиления b основного тона квантуется и передается в мультиплексор 713. Используется дополнительный бит, чтобы кодировать индекс j, причем этот дополнительный бит также подается в мультиплексор 713.

Когда определен основной тон или параметры b, T и j ДП (долгосрочного предсказания), следующий этап состоит из поиска оптимального нового возбуждения посредством модуля 710 поиска нового возбуждения фиг.7. Сначала обновляется вектор х c помощью вычитания вклада ДП:

х'=x-byT,

где b - коэффициент усиления основного тона, а yT - отфильтрованный вектор кодовой книги основного тона (прошлое возбуждение с задержкой Т, отфильтрованной с помощью частотного формирующего фильтра (индекс j) и свернутой с помощью импульсного отклика h).

Процедура поиска нового возбуждения в ЛПКВ выполняется в новой кодовой книге, чтобы найти оптимальный кодовый вектор ck возбуждения и коэффициент усиления b, которые минимизируют среднеквадратичную ошибку между вектором х цели и масштабированным отфильтрованным вариантом кодового вектора ck, например,

E=||x'-gHck||2,

где H - нижняя треугольная матрица свертки, полученная из вектора h импульсного отклика. Индекс k новой кодовой книги, соответствующей найденному оптимальному кодовому вектору ck, и коэффициент усиления g подаются в мультиплексор 213 для передачи через канал связи.

Следует заметить, что использованная новая кодовая книга может быть динамической кодовой книгой, состоящей из алгебраической кодовой книги, за которой следует адаптивный предварительный фильтр F(z), который расширяет данные спектральные составляющие для того, чтобы улучшить качество синтеза речи, в соответствии с патентом США 5444816, выданным Адоул и др. 22 августа 1995 г. Более конкретно, поиск новой кодовой книги может быть выполнен в модуле 710 посредством алгебраической кодовой книги, как описано в патентах США, номера: 5444816 (Адоул и др.), выданном 22 августа 1995 г.; 5699483, выданном Адоул и др. 17 декабря 1997 г.; 5754976, выданном Адоул и др. 19 мая 1998 г.; и 5701392 (Адоул и др.), датированном 23 декабря 1997 г.

Обзор декодера АМ-Ш

Декодер 800 речи фиг.8 иллюстрирует различные этапы, выполняемые между цифровым входным сигналом 822 (входным битовым потоком в демультиплексор 817) и выходным выборочным речевым сигналом 823 (выходной сигнал сумматора 821).

Демультиплексор 817 извлекает параметры кодирования сигнала из двоичной информации (входного битового потока 822), принятой из цифрового входного канала. Из каждого принятого двоичного кадра извлеченными параметрами кодирования сигнала являются:

- квантованные интерполированные коэффициенты ЛП В(z) (линия 825), также называемые параметрами краткосрочного предсказания (STP, КП), создаваемые один раз за кадр;

- параметры T, b и j долгосрочного предсказания (ДП) (для каждого подкадра); и

- новый индекс k возбуждения и коэффициент g усиления (для каждого подкадра).

Текущий речевой сигнал синтезируется на основании этих параметров, как будет объяснено ниже в настоящем описании.

Новая кодовая книга 818 возбуждения реагирует на индекс k для создания нового кодового вектора ck, который масштабируется с помощью декодированного нового коэффициента усиления g возбуждения посредством усилителя 824. Эта новая кодовая книга 818, как описано в вышеупомянутых патентах США, номера: 5444816; 5699482; 5754976; и 5701392 используется для создания нового кодового вектора ck.

Сгенерированный масштабированный кодовый вектор gck на выходе усилителя 824 обрабатывается посредством зависимого от частоты устройства 805 расширения основного тона.

Расширение периодичности сигнала u возбуждения улучшает качество звонких сегментов. Расширение периодичности достигается с помощью фильтрации нового кодового вектора ck из новой (фиксированной) кодовой книги возбуждения посредством фильтра F(z) нововведения (устройства 805 расширения основного тона), частотная характеристика которого выделяет высокие частоты более чем низкие частоты. Коэффициенты фильтра F(z) нововведения связаны с величиной периодичности в сигнале u возбуждения.

Эффективным возможным способом, чтобы получить коэффициенты фильтра F(z) нововведения, является осуществление связи их с величиной вклада основного тона в полный сигнал u возбуждения. Это имеет результатом частотную характеристику, зависящую от периодичности подкадра, где высокие частоты более сильно выделяются (более сильная общая кривая) для более высоких коэффициентов усиления основного тона. Фильтр 805 нововведения имеет действие понижения энергии кодового вектора ck нововведения на низких частотах, когда сигнал u возбуждения является более периодичным, что расширяет периодичность сигнала u возбуждения на низких частотах больше, чем на высоких частотах. Предложенный вид для фильтра 805 нововведения является следующим:

F(z)=-αz + 1 - αz-1,

где α - коэффициент периодичности, полученный из уровня периодичности сигнала u возбуждения. Коэффициент α периодичности вычисляется в генераторе 804 коэффициента звучания. Сначала коэффициент rv звучания вычисляется в генераторе 804 коэффициента звучания с помощью

rv=(Ev - Ec)/(Ev + Ec),

где Еv - энергия масштабированного кодового вектора bvT основного тона, а Ес - энергия масштабированного нового кодового вектора gck. То есть:

и

Заметим, что величина rv находится между -1 и 1 (1 соответствует чисто звонким сигналам, а -1 соответствует чисто незвонким сигналам).

Вышеупомянутый масштабированный кодовый вектор bvT основного тона создается с помощью подачи задержки Т основного тона в кодовую книгу 801 основного тона, чтобы создать кодовый вектор основного тона. Затем кодовый вектор основного тона обрабатывается посредством фильтра нижних частот или полосового фильтра 802, частота отсечки которого выбирается в связи с индексом j из демультиплексора 817, чтобы создать отфильтрованный кодовый вектор vT основного тона. Затем отфильтрованный кодовый вектор vT основного тона усиливается на коэффициент b усиления с помощью усилителя 826, чтобы создать масштабированный кодовый вектор vT основного тона.

Затем вычисляется коэффициент α звучания в генераторе 804 коэффициента звучания с помощью:

α=0,125(1 + rv),

который соответствует величине 0 для чисто незвонких сигналов и 0,25 для чисто звонких сигналов.

Следовательно, расширенный сигнал cf вычисляется с помощью фильтрации масштабированного нового кодового вектора gck посредством фильтра 805 (F(z)) нововведения.

Расширенный сигнал u' возбуждения вычисляется с помощью сумматора 820 как:

u' = cf + bvT

Следует заметить, что этот процесс не выполняется в кодере 700. Следовательно, существенным является обновление содержимого кодовой книги 801 основного тона с использованием прошлой величины сигнала u возбуждения без расширения, запомненного в памяти 803, чтобы поддерживать синхронность между кодером 700 и декодером 800. Следовательно, сигнал u возбуждения используется, чтобы обновить память 803 кодовой книги 801 основного тона, а расширенный сигнал u возбуждения используется на входе фильтра 804 синтеза ЛП.

Синтезированный сигнал s' вычисляется с помощью фильтрации расширенного сигнала u' возбуждения посредством фильтра 806 синтеза ЛП, который имеет вид 1/В(z), где В(z) квантованный интерполированный фильтр ЛП в текущем подкадре. Как видно на фиг.8, квантованные интерполированные коэффициенты В(z) ЛП на линии 825 из демультиплексора 817 подаются в фильтр 806 синтеза ЛП, чтобы соответствующим образом настроить параметры фильтра 806 синтеза ЛП. Фильтр 807 отмены выделения является обратным фильтру 703 предварительного выделения фиг.7. Передаточная функция фильтра 807 отмены выделения задается с помощью

D(z)=1/(1 - μz-1),

где μ - коэффициент предварительного выделения с величиной, находящейся между 0 и 1 (типичная величина равна μ=0,7). Также мог бы быть использован фильтр более высокого порядка.

Вектор s' фильтруется посредством фильтра D(z) 807 отмены выделения, чтобы получить вектор sd, который обрабатывается посредством фильтра 808 верхних частот, чтобы удалить нежелательные частоты ниже 50 Гц и дополнительно получить sh.

Устройство 809 дискретизации с повышением частоты проводит обратный процесс устройства 701 дискретизации с понижением частоты фиг.7. Например, дискретизация с повышением частоты преобразует частоту дискретизации 12,8 кГц обратно в исходную частоту дискретизации 16 кГц с использованием способов, хорошо известных обычным специалистам в данной области техники. Дискретизированный с повышением частоты сигнал синтеза обозначен s. Сигнал s также называется синтезированным широкополосным промежуточным сигналом.

Дискретизированный с повышением частоты сигнал синтеза не содержит высокочастотные составляющие, которые были потеряны во время процесса дискретизации с понижением частоты (модуль 701 фиг.7) в кодере 700. Это дает восприятие нижних частот в синтезированном речевом сигнале. Чтобы восстановить полную полосу частот исходного сигнала, выполняется процедура генерирования высокой частоты в модуле 819 и требует входной сигнал из генератора 804 голосового коэффициента (фиг.8).

Результирующая, отфильтрованная с помощью полосового фильтра, шумовая последовательность z из модуля 310 генерирования высокой частоты суммируется с помощью сумматора 821 с дискретизированным с повышением частоты синтезированным речевым сигналом чтобы получить окончательный восстановленный выходной речевой сигнал sout на выходе 823. Пример процесса генерирования высокой частоты описан в международной заявке на патент PCT, опубликованной под № WO 00/25305 в мае 2000 г.

Ссылаясь опять на фиг.3, в режиме связи с полной скоростью передачи кодек, в соответствии со стандартом АМ-Ш, работает с 12,65 Кбит/с и используется с распределением бит, приведенным в таблице 1. Использование скорости 12,65 Кбит/с кодека АМ-Ш дает возможность конструирования кодека с переменной скоростью передачи для системы CDMA2000, которая может взаимодействовать с другими системами, использующими стандарт кодека АМ-Ш. Дополнительные 13 бит добавляются, чтобы помещаться в полную скорость 13,3 Кбит/с множества II скорости CDMA2000. Эти биты используются, чтобы улучшить надежность кодека в случае стертых кадров. Большие подробности о кодеке АМ-Ш можно найти в ссылке "ITU-T Recommendation G.722.2 "Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)", Geneva, 2002". Кодек основан на модели алгебраического линейного предсказания с кодовым возбуждением (ACELP, АЛПКВ), оптимизированной для широкополосных сигналов. Он работает с речевыми кадрами 20 мс с частотой дискретизации 18 кГц. Параметры фильтра НЧ кодируются один раз за кадр с использованием 46 бит. Затем кадр разделяется на четыре подкадра, где индексы адаптивной и фиксированной кодовой книги и коэффициенты усиления кодируются один раз за кадр. Фиксированная кодовая книга составлена с использованием структуры алгебраической кодовой книги, где 64 позиции в подкадре разделены на четыре дорожки перемежающихся позиций и где два импульса со знаком размещены на каждой дорожке. Два импульса каждой дорожки кодируются с использованием девяти бит, давая всего 36 бит на подкадр.

Таблица 1

Распределение бит стандарта АМ-Ш с 12,65 Кбит/с

(кадры 20 мс содержат четыре подкадра)
ПараметрБит/Кадр
Флаг ДРА1
Параметры НЧ46
Задержка основного тона30=9+6+9+6
Фильтрация основного тона4=1+1+1+1
Коэффициенты усиления28=7+7+7+7
Алгебраическая кодовая книга144=36+36+36+36
Всего253 бита

На основании АМ-Ш с 12,65 Кбит/с широкополосное с переменной скоростью передачи (VBR-WB, Ш-ПерСП) решение может работать в соответствии с несколькими режимами передачи, из которых один режим является функционально совместимым с АМ-Ш с 12,65 Кбит/с. Следовательно, используются два варианта полной скорости (ПолнСП), функционально совместимая ПолнСП, где добавляются 13 неиспользованных бит, чтобы получить 13,3 Кбит/с, и общая или специфическая для МДКР ПолнСП, где используются биты ДРА и дополнительные имеющиеся 13 бит, чтобы передавать информацию, которая улучшает надежность кодека против стираний кадров (FER, СК). Распределение бит двух вариантов кодирования с ПолнСП показано в таблице 2. Следует отметить, что никакие дополнительные биты не требуются для информации классификации кадров. Защита СК из 14 бит содержит информацию энергии из 6 бит. Следовательно, только 63 уровня используются, чтобы квантовать энергию, и последний уровень, соответствующий величине 63, зарезервирован для того, чтобы указывать использование функционально совместимого режима. Следовательно, в случае функционально совместимой ПолнСП индекс информации энергии устанавливается в 63.

Таблица 2

Распределение бит общей и функционально совместимой полной скорости передачи множества II скорости CDMA2000, основанное на стандарте АМ-Ш с 12,65 Кбит/с
Бит в кадре
ПараметрОбщая ПолнСПФункционально совместимая ПолнСП
Информация классификации--
Бит ДРА-1
Параметры НЧ4646
Задержка основного тона3030
Фильтрация основного тона44
Коэффициенты усиления2828
Алгебраическая кодовая книга144144
Бит защиты СК14-
Неиспользованные биты-13
Всего266266

В случае стабильных звонких кадров используется модуль 206 кодирования половинной скорости звонких кадров. Распределение битов звонких кадров с половинной скоростью дано в таблице 3. Поскольку кадры, кодируемые в этом режиме передачи, являются типично очень периодическими, существенно более низкая скорость передачи достаточна для поддерживания хорошего субъективного качества, например, по сравнению с переходными кадрами. Используется модификация сигнала, что дает возможность эффективного кодирования информации задержки с использованием только девяти бит в кадре 20 мс, сохраняя значительную часть запаса бит для других параметров кодирования сигнала. При модификации сигнала сигнал заставляют следовать определенному контуру основного тона, который может быть передан с помощью 9 бит в кадре. Хорошая эффективность долгосрочного предсказания позволяет использовать только 12 бит в подкадре из 5 мс для возбуждения фиксированной кодовой книги без ухудшения субъективного качества речи. Фиксированная кодовая книга является алгебраической кодовой книгой и содержит две дорожки, по одному импульсу в каждой, при этом каждая дорожка имеет 32 возможные позиции.

Таблица 3

Распределение бит общей половинной скорости звонких кадров, незвонких кадров в соответствии с множеством II скорости CDMA2000
Бит в кадре
ПараметрОбщая ПолнСППолСП звонких кадровПолСП незвонких кадров
Информация классификации132
Бит ДРА---
Параметры НЧ363646
Задержка основного тона139-
Фильтрация основного тона-2-
Коэффициенты усиления262624
Алгебраическая кодовая книга484852
Бит защиты СК---
Неиспользованные биты---
Всего124124124

В случае незвонких кадров адаптивная кодовая книга (или кодовая книга основного тона) не используется. Гауссова кодовая книга из 13 бит используется в каждом подкадре, где коэффициент усиления кодовой книги кодируется с помощью 6 бит в кадре. Заметим, что в случаях, когда требуется дополнительно уменьшить среднюю скорость передачи, четверть скорости передачи для незвонких кадров может быть использована в случае стабильных незвонких кадров.

Режим (312) общей половинной скорости передачи используется для сегментов низкой энергии, как изображено на фиг.3. Этот режим (312) общей ПолСП также может использоваться при работе с максимальной половинной скоростью, как будет объяснено позже. Распределение бит для общей ПолСП показано в представленной выше таблице 3.

В качестве примера, для информации классификации для разных кодеров ПолСП в случае общей ПолСП 1 бит используется, чтобы указать, является ли кадр общей ПолСП или другим ПолСП. В случае ПолСП незвонких кадров 2 бит используются для классификации первый бит для указания, что кадр не является общей ПолСП, а второй бит для указания, что он является ПолСП незвонких кадров, а не ПолСП звонких кадров или функционально совместимой ПолСП (объясняемых позже). В случае ПолСП звонких кадров используются 3 бита: первые два бита указывают, что кадр не является общей ПолСП или ПолСП незвонких кадров, а третий бит указывает, является ли кадр ПолСП незвонким или функционально совместимой ПолСП.

Модуль 208 кодирования с одной восьмой скорости передачи (ГКШ) используется, чтобы кодировать неактивные речевые кадры (молчание или фоновый шум). В этом случае кодируются только параметры фильтра ЛП с помощью 14 бит в кадре, а коэффициент усиления кодируется с помощью 6 бит в кадре. Распределение бит указано в таблице 4.

Таблица 4

Распределение бит одной восьмой скорости передачи с 1,0 Кбит/с для кадра 20 мс
ПараметрБит/Кадр
Параметры ЛП14
Коэффициенты усиления6
Всего20 бит/кадр = 1,0 Кбит/с

Работа с половинной скоростью передачи, навязанной системой

В соответствии со схемой кодирования МДКР система может навязать использование половинной скорости передачи вместо полной скорости передачи в некоторых речевых кадрах для того, чтобы послать сигнальную информацию по каналам сети. Это называется передачей сигналов размерности и пачки. Использование половинной скорости передачи в качестве максимальной скорости передачи также может быть навязано системой во время плохих состояний канала (таких как около границ ячейки) для того, чтобы улучшить надежность кодека. Это называется максимумом половинной скорости. В конфигурации кодирования с ПерСП, описанной выше, половинная скорость используется, когда кадр является стационарным звонким или стационарным незвонким. Полная скорость передачи используется для начальных, переходных кадров и смешанных звонких кадров. Когда модуль выбора скорости выбирает кадр, кодируемый как кадр с полной скоростью передачи, а система навязывает кадр с половинной скоростью передачи, эффективность речи ухудшается, поскольку режимы передачи с половинной скоростью передачи не могут эффективно кодировать начальные и переходные кадры.

Кроме того, при вызове операции без последовательного соединения каналов в кросс-системе между CDMA2000, использующей решение множества II скорости ПерСП, основанное на АМ-Ш, и другой системой, использующей стандарт АМ-Ш, система CDMA2000, в конечном итоге, может навязать половинную скорость передачи, как объяснено ранее (такую как передача сигналов размерности и пачки). Поскольку кодек АМ-Ш не распознает половинную скорость передачи 6,2 Кбит/с широкополосного кодека CDMA2000, следовательно, кадры с половинной скоростью передачи интерпретируются как стертые кадры. Это ухудшает эффективность соединения.

Неограничительный иллюстративный вариант осуществления настоящего изобретения реализует новый способ, чтобы улучшить эффективность кодеков с переменной скоростью передачи, работающих в беспроводных системах МДКР, в ситуациях, когда половинная скорость навязана системой. Кроме того, этот новый способ улучшает эффективность в случае работы кросс-системы без последовательного соединения каналов между CDMA2000, использующей решение множества II скорости ПерСП, основанное на АМ-Ш, и другой системой, использующей кодек АМ-Ш, когда система CDMA2000, в конечном итоге, может навязать использование половинной скорости передачи.

При управлении размерностью и пачками или работе с максимумом половинной скорости передачи, когда система запрашивает использование половинной скорости передачи, в то время как выбрана полная скорость передачи с помощью механизма классификации, это указывает, что кадр не является ни незвонким, ни стабильным звонким, и кадр, вероятно, должен содержать нестационарный речевой сегмент, такой как звонкий начальный или быстро изменяющийся звонкий речевой сигнал. Следовательно, использование половинной скорости передачи, оптимизированной для незвонких или стабильных звонких сигналов, ухудшает эффективность речи. В этом случае необходим новый режим с половинной скоростью передачи, и введена общая ПолСП, которая может использоваться в таких случаях. Следовательно, в случае максимума половинной скорости передачи или операции размерности и пачки кодер использует общую ПолСП, если не классифицирован как ПолСП звонких кадров или незвонких кадров. Однако в системах CDMA2000 имеется операция, известная как передача сигналов на пакетном уровне, посредством чего сигнальная информация не передается в кодер, и система может навязать использование ПолСП после того, как кадр закодирован. Следовательно, если кадр закодирован как ПолнСП, а система требует использования ПолСП, тогда кадр будет объявлен как стертый. Кроме того, в случае максимума половинной скорости передачи или операции размерности и пачки в функционально совместимом режиме, когда кодер с ПерСП взаимодействует с АМ-Ш с 12,65 Кбит/с, тогда общая ПолСП не может быть использована, поскольку она не является частью АМ-Ш. Чтобы избежать стирания кадра в этих ситуациях (передача сигналов на пакетном уровне, или размерность и пачки и максимум половинной скорости передачи в режиме функциональной совместимости) неограничительный иллюстративный вариант осуществления настоящего изобретения использует режим половинной скорости передачи, непосредственно полученный из режима полной скорости с помощью удаления части параметров кодирования сигнала, например индексов фиксированной кодовой книги, после того, как кадр закодирован как кадр с полной скоростью передачи. На стороне декодера удаленная часть параметров кодирования сигнала, например индексы фиксированной кодовой книги, могут быть произвольно сгенерированы, и декодер будет работать так, как будто он находится на полной скорости передачи. Этот режим половинной скорости передачи называется сигнальной ПолСП или функционально совместимой ПолСП, поскольку как кодирование, так и декодирование выполняется с полной скоростью передачи. Распределение бит режима функционально совместимой половинной скорости передачи в соответствии с неограничительным иллюстративным вариантом осуществления настоящего изобретения дано в таблице 5. В этом неограничительном иллюстративном варианте осуществления полная скорость передачи основана на стандарте АМ-Ш с 12,65 Кбит/с, и половинная скорость получается с помощью удаления 144 битов, необходимых для индексов алгебраической фиксированной кодовой книги. Различие между сигнальной ПолСП и функционально совместимой ПолСП заключается в том, что сигнальная ПолСП используется в операции передачи сигналов на пакетном уровне в системе CDMA2000, а биты защиты СК все же могут быть использованы. Сигнальная ПолСП получается непосредственно из общей ПолнСП, изображенной в таблице 1, с помощью удаления 144 бит для индексов алгебраической кодовой книги. Три индекса добавлены для информации класса, и только шесть индексов используются для защиты СК, что оставляет пять неиспользованных бит. Функционально совместимая ПолСП получается из функционально совместимой ПолнСП с помощью удаления 144 бит для индексов алгебраической кодовой книги. Три индекса добавлены для информации класса, что оставляет 12 неиспользованных бит. Как объяснено ранее при обсуждении информации классификации в случае разных половинных скоростей, три бит используются в случае ПолСП звонких кадров или функционально совместимой ПолСП. Никакая дополнительная информация не посылается, чтобы различать сигнальную ПолСП и функционально совместимую ПолСП. Подобно случаю ПолнСП, последний уровень информации энергии из 6 бит используется для этой цели. Только 63 уровня используются, чтобы квантовать энергию, а последний уровень, соответствующий величине 63, зарезервирован, чтобы указывать использование функционально совместимого режима. Следовательно, в случае функционально совместимой ПолСП индекс информации энергии устанавливается в 63.

Таблица 5

Распределение бит сигнальной и функционально совместимой половинной скорости передачи с 6,2 Кбит/с
Бит в кадре
ПараметрСигнальная ПолСПФункционально совместимая ПолСП
Информация классификации33
Бит ДРА-1
Параметры НЧ4646
Задержка основного тона3030
Фильтрация основного тона44
Коэффициенты усиления2828
Алгебраическая кодовая книга--
Бит защиты СК8-
Неиспользованные биты512
Всего 124124

Фиг.4 изображает функциональную схематическую блок-схему фиг.3 с помощью добавления системного запроса для использования половинной скорости в логических схемах определения скорости. Конфигурация фиг.3 подходит для работы в системе CDMA2000. В конце цепочки определения скорости модуль 404 проверяет, присутствует ли системный запрос половинной скорости передачи. Если логическая схема определения скорости указывает, что кадр является активным речевым кадром (модуль 201), и он не является ни незвонким (модуль 202), ни стабильным звонким (модуль 203), ни кадром с низкой энергией (модуль 311), а система запрашивает работу с половинной скоростью передачи (модуль 404), тогда используется общая половинная скорость передачи, чтобы кодировать кадр в модуле 312.

В противном случае (не присутствует системный запрос половинной скорости передачи) речевой кадр кодируется в модуле 205 как кадр с полной скоростью передачи (13,3 Кбит/с в соответствии с множеством II скорости CDMA2000).

В неограничительном иллюстративном варианте осуществления настоящего изобретения, как изображено на фиг.5, логические схемы определения скорости и кодирование с переменной скоростью являются теми же самыми, что и на фиг.3. Однако после того, как кадр закодирован и бит переданы, выполняется тест, чтобы проверить, запрашивает ли система работу с половинной скоростью передачи в модуле 514. Если это справедливо и переданный кадр является кадром с ПолнСП, тогда часть параметров кодирования сигнала, например индексы фиксированной кодовой книги, удаляется, для того, чтобы получить кадр с сигнальной половинной скоростью передачи (модуль 510). Заметим, что в этом неограничительном иллюстративном варианте осуществления от одного до трех бит используются для режима с половинной скоростью передачи (общей, звонких кадров, незвонких кадров или функционально совместимой). Следовательно, 3 бит, указывающих сигнальную или функционально совместимую половинную скорость передачи, добавляются после того, как удалена часть параметров кодирования сигнала (индексы фиксированной кодовой книги). Бит в кадре распределены в соответствии с таблицей 5.

Выбор удаления индексов фиксированной кодовой книги является благодаря тому факту, что эти бит наименее чувствительны к ошибкам, и произвольное их генерирование имеет малое влияние на эффективность. Однако следует иметь в виду, что могут быть удалены другие бит, чтобы получить функционально совместимую или сигнальную половинную скорость без потери общности.

В этом неограничительном иллюстративном варианте осуществления при работе с сигнальной или функционально совместимой половинной скоростью передачи на стороне кодера кодер работает как кодер с полной скоростью передачи. Поиск фиксированной кодовой книги выполняется как обычно, и определенное возбуждение фиксированной кодовой книги используется при обновлении содержимого адаптивной кодовой книги и памяти фильтров для следующих кадров в соответствии со стандартом АМ-Ш с 12,65 Кбит/с [ITU-T Recommendation G.722.2 "Wideband coding of speech at around 12,65 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)", Geneva, 2002] [3GPP TS 26.190, "AMR Wideband Codec: Transcoding Functions," 3GPP Technical Specification]. Следовательно, никакие индексы произвольной кодовой книги не используются в работе кодера. Это очевидно в реализации фиг.5, где системный запрос половинной скорости передачи (модуль 514) проверяется после того, как кадр закодирован при нормальной работе с полной скоростью передачи.

При работе с сигнальной или функционально совместимой половинной скоростью передачи на стороне декодера удаленная часть параметров кодирования сигнала, например индексы фиксированной кодовой книги, произвольно генерируется. Затем декодер работает, как при работе с полной скоростью передачи. Могут быть использованы другие способы для генерирования удаленной части параметров кодирования сигнала. Например, удаленные параметры могут быть получены с помощью копирования частей принятого битового потока. Заметим, что может случаться несоответствие между памятью на стороне кодера и стороне декодера, поскольку удаленная часть параметров кодирования сигнала, например возбуждение кодовой книги, является разной. Однако такое несоответствие не оказывает влияния на эффективность, особенно в случае передачи сигналов размерности пачки при взаимодействии между CDMA ПерСП и АМ-Ш, где типичные скорости передачи находятся около 2%.

Эффективность предложенного подхода в операции размерности и пачки является почти прозрачной по сравнению со случаем, когда нет системного запроса половинной скорости передачи. Во многих случаях логические схемы определения скорости передачи уже определяет кадр, кодируемый либо с одной восьмой скорости передачи, одной четвертой скорости передачи, либо с половинной скоростью передачи (общей, звонких кадров или незвонких кадров). В таком случае запросом системы половинной скорости передачи пренебрегают, поскольку она уже адаптирована с помощью кодера, и тип сигнала в кадре подходит для кодирования с половинной скоростью передачи или более низкой скоростью передачи.

Следует заметить, что логические схемы классификации являются настраиваемыми с режимом работы. Следовательно, для того чтобы улучшить эффективность в режиме максимума половинной скорости передачи и передачи сигналов размерности и пачки, эти логические схемы классификации могут быть сделаны более уменьшенными для использования конкретных кодеков с половинной скоростью передачи (половинная скорость передачи звонких и незвонких кадров используется относительно более часто, чем нормальная работа). Это является видом возбуждения для многорежимной работы, где логическая схема классификации более уменьшена, и используются режимы с более низкими средними скоростями передачи.

Работа без последовательного соединения каналов между системой CDMA2000 и другими системами с использованием стандарта АМ-Ш

Как упомянуто ранее, конструирование широкополосного с переменной скоростью передачи (Ш-ПерСП) кодека для системы CDMA2000, основанного на кодеке АМ-Ш, имеет преимущество в предоставлении возможности работы без последовательного соединения каналов (TFO, РБПСК) или работы с коммутацией пакетов между системой CDMA2000 и другими системами, использующими стандарт АМ-Ш (такими как мобильная система GSM или беспроводная система третьего поколения Ш-МДКР). Однако при вызове операции без последовательного соединения каналов в кросс-системе между CDMA 200 и другой системой, использующей АМ-Ш, система CDMA2000 может навязать использование половинной скорости передачи, как объяснено ранее (такой как передача сигналов размерности и пачки). Поскольку кодек АМ-Ш не распознает половинную скорость передачи 6,2 Кбит/с широкополосного кодека CDMA2000, следовательно, навязанные кадры с половинной скоростью передачи интерпретируются как стертые кадры. Это ухудшает эффективность соединения. Использование режима функционально совместимой половинной скорости передачи, раскрытого ранее, значительно улучшит эффективность, поскольку этот режим может взаимодействовать со скоростью передачи 12,65 Кбит/с стандарта AM-Ш.

Как раскрыто в настоящем описании ранее, функционально совместимая половинная скорость передачи, по существу, является псевдополной скоростью передачи, где кодек работает, как будто он находится в режиме с полной скоростью передачи. Отличие заключается в том, что часть параметров кодирования сигнала, например индексы алгебраической кодовой книги, удаляется в конце и не передается. На стороне декодера удаленная часть параметров кодирования сигнала, например индексы алгебраической кодовой книги, произвольно генерируется, а затем декодер работает, как будто он находится в режиме с полной скоростью передачи.

Фиг.6 иллюстрирует конфигурацию в соответствии с неограничительным иллюстративным вариантом осуществления настоящего изобретения, демонстрирующую использование режима функционально совместимой половинной скорости передачи во время передачи по каналам сети сигнальной информации (т.е. состояния размерности и пачки) на стороне системы CDMA2000. На этой фигуре другой стороной является система, использующая стандарт АМ-Ш, и в качестве примера дана беспроводная система 3GPP.

По линии связи с направлением из CDMA2000 в 3GPP или другую систему, использующую АМ-Ш, когда подуровень мультиплексора указывает запрос режима с половинной скоростью передачи (см. запрос 601 системы размерности и пачки), кодер 602 Ш-ПерСП будет работать с функционально совместимой половинной скоростью передачи (I-HR, ФС-ПолСП), описанной ранее. В системном интерфейсе 604, когда принят кадр ФС-ПолСП, произвольно сгенерированные индексы алгебраической кодовой книги вставляются с помощью модуля 603 в битовый поток через системный интерфейс 604, основанный на IP, чтобы вывести скорость передачи 12,65 Кбит/с. Декодер 605 на стороне 3GPP будет интерпретировать его как обычный кадр 12,65 Кбит/с.

В другом противоположном направлении, то есть по линии связи из 3GPP или другой системы, использующей AM-Ш, в CDMA2000, если в системном интерфейсе 606 принят запрос половинной скорости передачи (см. запрос 607 системы размерности и пачки), тогда модуль 608 удаляет индексы алгебраической кодовой книги и вставляет 3 бит, указывающих тип кадра ФС-ПолСП. Декодер 609 на стороне CDMA2000 будет работать как тип кадра ФС-ПолСП, который является частью решения Ш-ПерСП.

Это предложение требует минимальных логических схем в системном интерфейсе, и оно существенно улучшает эффективность посредством навязывания кадров размерности и пачки как кадров пропуска и пачки (стертых кадров).

Другим вопросом при взаимодействии является обработка кадров фонового шума. На стороне АМ-Ш кодер 610 поддерживает работу DTX, ИП (импульсная передача) и CNG, ГКШ (генерирование комфортного шума). Неактивные речевые кадры (молчание или фоновый шум) либо кодируются как кадры SID, ОМ (описание молчания) с использованием 35 бит, либо они не передаются (нет данных). На стороне CDMA2000 неактивные речевые кадры кодируются с использованием одной восьмой скорости передачи (ОВСП). Поскольку 35 бит для ОМ не могут быть посланы с использованием ОВСП, используется одна четвертая скорости передачи (ОЧСП) ГКШ, чтобы послать кадры ОМ из стороны АМ-Ш в сторону CDMA2000. Не переданные кадры без данных на стороне АМ-Ш преобразуются в кадры ОВСП (в иллюстративном варианте осуществления все бит устанавливаются в 1). На стороне CDMA2000 в функционально совместимом режиме кадры ОВСП обрабатываются с помощью декодера как стирания кадров.

При взаимодействии из CDMA2000 со стороной АМ-Ш в начале неактивных речевых сегментов используется ОЧСП ГНШ, затем используются кадры ОВСП. В неограничительном иллюстративном варианте осуществления изобретения работа подобна работе ДРА/ИП/ГКШ в АМ-Ш, где кадр ОМ посылается один раз в каждые восемь кадров. В этом случае первый неактивный речевой кадр кодируется как кадр ОЧСП ГКШ, а следующие 7 кадров кодируются как кадры ОВСП. В системном интерфейсе кадры ОЧСП ГКШ преобразуются в кадры ОМ АМ-Ш, а кадры ОВСП не передаются (нет кадров данных).

Распределение бит кадров ОЧСП ГКШ и ОВСП ГКШ показано в таблице 6.

Таблица 6

Распределение бит ОЧСП ГКШ с 2,7 Кбит/с и ОВСП ГКШ с 1 Кбит/с для кадра 20 мс
Бит в кадре
ПараметрОЧСП ГКШОВСП ГКШ
Информация классификации1-
Параметры НЧ2814
Коэффициенты усиления66
Неиспользованные биты19-
Всего5420

Несмотря на то, что настоящее изобретение описано в вышеприведенном описании в связи с его неограничительным вариантом осуществления, этот иллюстративный вариант осуществления по желанию может быть модифицирован в рамках объема прилагаемой формулы изобретения, не выходя за рамки объема и сущности изобретения. В качестве примера, биты, отличные от битов, связанных с индексами фиксированной кодовой книги, в частности биты с меньшей чувствительностью к ошибкам бит, могут быть опущены для того, чтобы получить кадр с функционально совместимой половинной скоростью передачи.

1. Способ передачи параметров кодирования сигнала из первой станции во вторую станцию, причем первая станция использует первую схему связи и содержит первый кодер и первый декодер, а вторая станция использует вторую схему связи и содержит второй кодер и второй декодер, при этом связь между первой и второй станциями осуществляют с помощью передачи параметров кодирования сигнала из кодера одной из станций, первой или второй, в декодер другой из упомянутых первой и второй станций, заключающийся в том, что

кодируют звуковой сигнал с использованием первого кодера для генерирования параметров кодирования сигнала в соответствии с первой схемой связи;

принимают запрос для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию с использованием упомянутой второй схемы связи;

в ответ на запрос удаляют часть параметров кодирования сигнала, закодированных в соответствии с первой схемой связи, и передают в декодер другой станции остальные параметры кодирования сигнала, при этом на этапе удаления части параметров кодирования сигнала удаляют индексы фиксированной кодовой книги;

генерируют замену параметров кодирования сигнала для замены упомянутой части параметров кодирования сигнала и декодируют в декодере упомянутой другой станции параметры кодирования сигнала.

2. Способ по п.1, в котором на этапе приема запроса

принимают запрос для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию с использованием режима связи с половинной скоростью передачи.

3. Способ по п.1, в котором первая схема связи является широкополосной с переменной скоростью передачи (Ш-ПерСП) CDMA2000, а вторая схема связи является адаптивной многоскоростной широкополосной (АМ-Ш).

4. Способ по п.1, в котором на этапе декодирования параметров кодирования сигнала

управляют работой декодера упомянутой другой станции в режиме с полной скоростью передачи.

5. Способ по п.1, в котором на этапе генерирования замены параметров кодирования сигнала

произвольно генерируют замену параметров кодирования сигнала для замены упомянутой части параметров кодирования сигнала.

6. Способ по п.1, в котором

на этапе генерирования замены параметров кодирования сигнала произвольно регенерируют индексы фиксированной кодовой книги.

7. Способ по п.1, в котором

на этапе удаления части параметров кодирования сигнала из кодера упомянутой одной станции вставляют идентификацию режима связи и

на этапе передачи остальных параметров кодирования сигнала передают в декодер упомянутой другой станции идентификацию режима связи вместе с остальными параметрами кодирования сигнала.

8. Способ по п.1, в котором в кодере упомянутой одной станции выполняют поиск фиксированной кодовой книги для определения активизации фиксированной кодовой книги и

используют определенную активизацию фиксированной кодовой книги для обновления содержимого адаптивной кодовой книги и памятей фильтра для следующих кадров.

9. Способ передачи параметров кодирования сигнала из первой станции во вторую станцию, причем первая станция использует первую схему связи и содержит первый кодер и первый декодер, а вторая станция использует вторую схему связи и содержит второй кодер и второй декодер, при этом связь между первой и второй станциями осуществляют с помощью передачи параметров кодирования сигнала, связанных со звуковым сигналом, из кодера одной из станций, первой или второй, в декодер другой из упомянутых первой и второй станций, заключающийся в том, что

классифицируют звуковой сигнал для определения, должны ли быть переданы параметры кодирования сигнала из кодера упомянутой одной станции в декодер другой станции с использованием первого режима связи, в котором используют полную скорость передачи битов для передачи параметров кодирования сигнала;

принимают запрос для передачи параметров кодирования сигнала из кодера упомянутой одной станции в декодер другой станции с использованием второго режима связи, предназначенного для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала;

если классификация звукового сигнала определяет, что параметры кодирования сигнала должны быть переданы с использованием первого режима связи, и если принят запрос для передачи параметров кодирования сигнала с использованием второго режима связи, удаляют часть параметров кодирования сигнала из кодера упомянутой одной станции и передают в декодер другой станции остальные параметры кодирования сигнала с использованием второго режима связи, при этом на этапе удаления части параметров кодирования сигнала удаляют индексы фиксированной кодовой книги.

10. Способ по п.9, в котором на этапе приема запроса принимают запрос для передачи параметров кодирования сигнала из кодера упомянутой одной станции в декодер другой станции с использованием режима связи с половинной скоростью передачи.

11. Способ по п.9, в котором

на этапе удаления части параметров кодирования сигнала из кодера упомянутой одной станции вставляют идентификацию второго режима связи и

на этапе передачи остальных параметров кодирования сигнала передают в декодер упомянутой другой станции идентификацию второго режима связи вместе с остальными параметрами кодирования сигнала.

12. Способ по п.9, в котором дополнительно регенерируют упомянутую часть параметров кодирования сигнала и декодируют в декодере упомянутой другой станции упомянутые параметры кодирования сигнала в звуковой сигнал.

13. Способ по п.12, в котором на этапе регенерирования упомянутой части параметров кодирования сигнала произвольно регенерируют упомянутую часть параметров кодирования сигнала.

14. Способ передачи параметров кодирования сигнала из первой станции во вторую станцию, заключающийся в том, что

в одной из станций, первой или второй, кодируют звуковой сигнал в соответствии с режимом связи с полной скоростью передачи;

принимают запрос для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию из упомянутых первой и второй станций с использованием второго режима связи, предназначенного для уменьшения скорости передачи битов во время передачи упомянутых параметров кодирования сигнала;

в ответ на запрос преобразуют параметры кодирования сигнала, закодированные в режиме связи с полной скоростью передачи, в параметры кодирования сигнала, закодированные во втором режиме связи, при этом на этапе преобразования параметров кодирования сигнала, закодированных в режиме связи с полной скоростью передачи, в параметры кодирования сигнала, закодированные во втором режиме связи, удаляют часть параметров кодирования сигнала, и причем на подэтапе удаления части параметров кодирования сигнала удаляют индексы фиксированной кодовой книги; и

передают параметры кодирования сигнала, закодированные во втором режиме связи, в другую станцию из упомянутых первой и второй станций.

15. Способ по п.14, в котором на этапе приема запроса принимают запрос для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию с использованием режима связи с половинной скоростью передачи.

16. Способ по п.14, в котором

на этапе преобразования параметров кодирования сигнала, закодированных в режиме связи с полной скоростью передачи, в параметры кодирования сигнала, закодированные во втором режиме связи, вставляют идентификацию второго режима связи и

на этапе передачи параметров кодирования сигнала, закодированных во втором режиме связи, в другую станцию из упомянутых первой и второй станций передают в другую станцию идентификацию второго режима связи вместе с неудаленными параметрами кодирования сигнала.

17. Способ по п.14, в котором дополнительно регенерируют упомянутую часть параметров кодирования сигнала и в декодере упомянутой другой станции декодируют упомянутые параметры кодирования сигнала.

18. Способ по п.17, в котором на этапе регенерирования упомянутой части параметров кодирования сигнала произвольно регенерируют упомянутую часть параметров кодирования сигнала.

19. Система для передачи параметров кодирования сигнала из первой станции во вторую станцию, причем первая станция использует первую схему связи и содержит первый кодер и первый декодер, а вторая станция использует вторую схему связи и содержит второй кодер и второй декодер, при этом связь между первой и второй станциями осуществляется с помощью передачи параметров кодирования сигнала из кодера одной из станций, первой или второй, в декодер другой из упомянутых первой и второй станций, содержащая

средство, предназначенное для кодирования звукового сигнала с использованием первого кодера для генерирования параметров кодирования сигнала в соответствии с первой схемой связи;

средство, предназначенное для приема запроса для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию с использованием упомянутой второй схемы связи;

средство, предназначенное для удаления в ответ на упомянутый запрос части параметров кодирования сигнала, закодированных в соответствии с первой схемой связи, и средство, предназначенное для передачи в декодер другой станции остальных параметров кодирования сигнала; причем средство, предназначенное для удаления части параметров кодирования сигнала, содержит средство, предназначенное для удаления индексов фиксированной кодовой книги; и

средство, предназначенное для генерирования замены параметров кодирования сигнала для замены упомянутой части параметров кодирования сигнала, и средство, предназначенное для декодирования параметров кодирования сигнала в декодере упомянутой другой станции.

20. Система по п.19, в которой упомянутое средство приема запроса содержит средство, предназначенное для приема запроса для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию с использованием режима связи с половинной скоростью передачи.

21. Система по п.19, в которой первая схема связи является широкополосной с переменной скоростью передачи (Ш-ПерСП) CDMA2000, а вторая схема связи является адаптивной многоскоростной широкополосной (АМ-Ш).

22. Система по п.19, содержащая средство, предназначенное для управления работой декодера упомянутой другой станции в режиме с полной скоростью передачи.

23. Система по п.19, в которой средство, предназначенное для генерирования замены параметров кодирования сигнала, содержит

средство, предназначенное для произвольного генерирования замены параметров кодирования сигнала.

24. Система по п.19, в которой

средство, предназначенное для генерирования замены параметров кодирования сигнала, содержит средство, предназначенное для произвольного регенерирования замены индексов фиксированной кодовой книги.

25. Система по п.19, в которой

средство, предназначенное для удаления части параметров кодирования сигнала, содержит средство, предназначенное для вставки идентификации режима связи; и

средство, предназначенное для передачи остальных параметров кодирования сигнала, содержит средство, предназначенное для передачи в декодер упомянутой другой станции идентификации режима связи вместе с остальными параметрами кодирования сигнала.

26. Система по п.19, содержащая в кодере упомянутой одной станции средство, предназначенное для выполнения поиска фиксированной кодовой книги для определения активизации фиксированной кодовой книги;

и

средство, предназначенное для обновления содержимого адаптивной кодовой книги и памятей фильтра для следующих кадров с использованием определенной активизации фиксированной кодовой книги.

27. Система для передачи параметров кодирования сигнала из первой станции во вторую станцию, причем первая станция использует первую схему связи и содержит первый кодер и первый декодер, а вторая станция использует вторую схему связи и содержит второй кодер и второй декодер, при этом связь между первой и второй станциями осуществляется с помощью передачи параметров кодирования сигнала, связанных со звуковым сигналом, из кодера одной из станций, первой или второй, в декодер другой из упомянутых первой и второй станций, содержащая

средство, предназначенное для классификации звукового сигнала для определения, должны ли быть переданы параметры кодирования сигнала из кодера упомянутой одной станции в декодер другой станции с использованием первого режима связи, в котором используется полная скорость передачи битов для передачи параметров кодирования сигнала;

средство, предназначенное для приема запроса для передачи параметров кодирования сигнала из кодера упомянутой одной станции в декодер другой станции с использованием второго режима связи, предназначенного для уменьшения скорости передачи битов во время передачи параметров кодирования сигнала;

средство, предназначенное для удаления части параметров кодирования сигнала из кодера упомянутой одной станции и передачи в декодер другой станции остальных параметров кодирования сигнала с использованием второго режима связи, если классификация звукового сигнала определяет, что параметры кодирования сигнала должны быть переданы с использованием первого режима связи, и если принят запрос для передачи параметров кодирования сигнала с использованием второго режима связи, причем средство, предназначенное для удаления части параметров кодирования сигнала, содержит средство, предназначенное для удаления индексов фиксированной кодовой книги.

28. Система по п.27, в которой упомянутое средство приема запроса содержит

средство, предназначенное для приема запроса для передачи параметров кодирования сигнала из кодера упомянутой одной станции в декодер другой станции с использованием режима связи с половинной скоростью передачи.

29. Система по п.27, в которой

средство, предназначенное для удаления части параметров кодирования сигнала из кодера упомянутой одной станции, содержит средство, предназначенное для вставки идентификации второго режима связи; и

средство, предназначенное для передачи остальных параметров кодирования сигнала, содержит средство, предназначенное для передачи в декодер упомянутой другой станции идентификации второго режима связи вместе с остальными параметрами кодирования сигнала.

30. Система по п.27, дополнительно содержащая средство, предназначенное для регенерации упомянутой части параметров кодирования сигнала, и декодер упомянутой другой станции, предназначенный для декодирования упомянутых параметров кодирования сигнала в звуковой сигнал.

31. Система по п.30, в которой средство, предназначенное для регенерации упомянутой части параметров кодирования сигнала, содержит средство, предназначенное для произвольной регенерации упомянутой части параметров кодирования сигнала.

32. Система для передачи параметров кодирования сигнала из первой станции во вторую станцию, содержащая

в одной из станций, первой или второй, кодер, предназначенный для кодирования звукового сигнала в соответствии с режимом связи с полной скоростью передачи;

средство, предназначенное для приема запроса для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию из упомянутых первой и второй станций с использованием второго режима связи, предназначенного для уменьшения скорости передачи битов во время передачи упомянутых параметров кодирования сигнала;

средство, предназначенное для преобразования в ответ на запрос параметров кодирования сигнала, закодированных в режиме связи с полной скоростью передачи, в параметры кодирования сигнала, закодированные во втором режиме связи, причем средство, предназначенное для преобразования параметров кодирования сигнала, закодированных в режиме связи с полной скоростью передачи, в параметры кодирования сигнала, закодированные во втором режиме связи, содержит средство, предназначенное для удаления части параметров кодирования сигнала, и причем средство, предназначенное для удаления части параметров кодирования сигнала, содержит средство, предназначенное для удаления индексов фиксированной кодовой книги; и

средство, предназначенное для передачи параметров кодирования сигнала, закодированных во втором режиме связи, в упомянутую другую станцию из первой и второй станций.

33. Система по п.32, в которой упомянутое средство приема запроса содержит

средство, предназначенное для приема запроса для передачи параметров кодирования сигнала из упомянутой одной станции в другую станцию с использованием режима связи с половинной скоростью передачи.

34. Система по п.32, в которой

средство, предназначенное для преобразования параметров кодирования сигнала, закодированных в режиме связи с полной скоростью передачи, в параметры кодирования сигнала, закодированные во втором режиме связи, содержит средство, предназначенное для вставки идентификации второго режима связи; и

средство, предназначенное для передачи параметров кодирования сигнала, закодированных во втором режиме связи, в другую станцию из упомянутых первой и второй станций, содержит средство, предназначенное для передачи в другую станцию идентификации второго режима связи вместе с остальными параметрами кодирования сигнала.

35. Система по п.32, дополнительно содержащая средство, предназначенное для регенерации упомянутой части параметров кодирования сигнала, и декодер упомянутой другой станции, предназначенный для декодирования упомянутых параметров кодирования сигнала.

36. Система по п.35, в которой средство, предназначенное для регенерации упомянутой части параметров кодирования сигнала, содержит средство, предназначенное для произвольной регенерации упомянутой части параметров кодирования сигнала.

37. Способ кодирования звукового сигнала, предназначенный для использования с помощью устройства связи, заключающийся в том, что

кодируют речь части цифрового речевого сигнала для создания первого кадра, содержащего множество параметров кодирования сигнала; и

изменяют первый кадр с помощью удаления, по меньшей мере, одного параметра кодирования сигнала из первого кадра в соответствии, по меньшей мере, с одним критерием, таким образом, чтобы сформировать второй кадр, имеющий уменьшенное число параметров кодирования сигнала по сравнению с первым кадром, причем упомянутый критерий устанавливают в ответ на запас битов для текущего кадра, при этом запас битов, имеющийся для любого данного кадра, не фиксирован во времени.

38. Способ по п.37, в котором дополнительно принимают, по меньшей мере, часть второго кадра в устройстве связи.

39. Способ выполнения функциональной совместимости системного интерфейса, заключающийся в том, что

принимают кадр параметров кодирования сигнала, сгенерированных в первом устройстве связи, причем первое устройство связи содержит кодер речи, работающий в соответствии с первой схемой кодирования речи;

удаляют, по меньшей мере, один из параметров кодирования сигнала из принятого кадра для формирования измененного кадра и

передают, по меньшей мере, часть измененного кадра во второе устройство связи, причем второе устройство связи содержит декодер речи, работающий в соответствии со второй схемой кодирования речи и выполненный с возможностью генерирования множества выборок звукового сигнала на основании, по меньшей мере, частично, остальных параметров кодирования сигнала измененного кадра, причем упомянутая первая схема кодирования речи отличается от упомянутой второй схемы кодирования речи.

40. Способ выполнения функциональной совместимости системного интерфейса, заключающийся в том, что

вводят кадр, состоящий из множества параметров кодирования сигнала; и

удаляют, по меньшей мере, один параметр кодирования сигнала из кадра, состоящего из множества параметров кодирования сигнала, для формирования измененного кадра, причем, по меньшей мере, часть измененного кадра применима для генерирования множества выборок звукового сигнала.

41. Способ по п.40, в котором дополнительно передают измененный кадр.

42. Кодер речи, выполненный с возможностью работы в соответствии с первой схемой кодирования речи, содержащий кодер для кодирования, по меньшей мере, одного неактивного речевого кадра, по меньшей мере, в один закодированный кадр, причем, по меньшей мере, часть, по меньшей мере, одного закодированного кадра является передаваемой в декодер речи и является непосредственно используемой декодером речи, причем упомянутый декодер речи работает в соответствии со второй схемой кодирования речи, отличной от упомянутой первой схемы кодирования речи.

43. Кодер речи по п.42, в котором упомянутая, по меньшей мере, часть упомянутого, по меньшей мере, одного закодированного кадра, непосредственно используемая декодером речи, содержит, по меньшей мере, один параметр иммитанса спектральной частоты.

44. Декодер речи, выполненный с возможностью работы в соответствии с первой схемой кодирования речи, причем декодер речи выполнен с возможностью декодирования, по меньшей мере, одного неактивного речевого кадра, имеющего параметры кодирования сигнала, которые были сгенерированы с помощью кодера речи, работающего в соответствии со второй схемой кодирования речи, отличной от упомянутой первой схемы кодирования речи.

45. Способ выполнения функциональной совместимости системного интерфейса, заключающийся в том, что

принимают кадр, состоящий из параметров кодирования сигнала; и увеличивают содержимое кадра с помощью вставки, по меньшей мере, одного произвольного параметра кодирования сигнала.

46. Способ выполнения функциональной совместимости системного интерфейса, заключающийся в том, что

принимают кадр, состоящий из параметров кодирования сигнала; и увеличивают содержимое кадра с помощью копирования, по меньшей мере, одного из параметров кодирования сигнала.

47. Способ декодирования речи, заключающийся в том, что

принимают кадр, состоящий из параметров кодирования сигнала, причем, по меньшей мере, один параметр кодирования сигнала произвольно сгенерирован для компенсации, по меньшей мере, одного ранее удаленного параметра кодирования сигнала; и

декодируют параметры кодирования сигнала.

48. Декодер речи, содержащий

вход, предназначенный для приема кадра, состоящего из параметров кодирования сигнала, причем, по меньшей мере, один параметр кодирования сигнала произвольно сгенерирован для компенсации, по меньшей мере, одного ранее удаленного параметра кодирования сигнала; и

декодер, предназначенный для декодирования параметров кодирования сигнала для вывода восстановленного речевого сигнала.

49. Декодер речи, содержащий

вход, предназначенный для приема, по меньшей мере, одного кадра, состоящего из параметров кодирования сигнала,

по меньшей мере, часть декодера, выполненную с возможностью обработки кадра, который включает в себя, по меньшей мере, один параметр кодирования сигнала, который был вставлен в исходный кадр с более низкой скоростью передачи для формирования кадра с более высокой скоростью передачи, который принимается; и

по меньшей мере, часть декодера, предназначенную для декодирования параметров кодирования сигнала, для вывода восстановленного речевого сигнала.

50. Декодер речи по п.49, в котором кадр с более низкой скоростью передачи является кадром с половинной скоростью передачи, а кадр с более высокой скоростью передачи является кадром с полной скоростью передачи.

51. Носитель информации, доступный для чтения с помощью компьютера, содержащий команды программы, подходящие для использования с помощью устройства связи, для выполнения операций, заключающихся в том, что

кодируют речь части цифрового речевого сигнала для создания первого кадра, состоящего из множества параметров кодирования сигнала; и

изменяют первый кадр с помощью удаления, по меньшей мере, одного параметра кодирования сигнала из первого кадра в соответствии с, по меньшей мере, одним критерием таким образом, чтобы сформировать второй кадр, имеющий уменьшенное число параметров кодирования сигнала по сравнению с первым кадром, причем упомянутый критерий устанавливают в ответ на запас битов для текущего кадра, при этом запас битов, имеющийся для любого данного кадра, не фиксирован во времени.

52. Носитель информации, доступный для чтения с помощью компьютера, содержащий команды программы, подходящие для использования с помощью устройства связи, для выполнения операций, заключающихся в том, что принимают кадр параметров кодирования сигнала, сгенерированных в первом устройстве связи, причем первое устройство связи содержит кодер речи, работающий в соответствии с первой схемой кодирования речи;

удаляют, по меньшей мере, один из параметров кодирования сигнала из принятого кадра для формирования измененного кадра и

передают, по меньшей мере, часть измененного кадра во второе устройство связи.

53. Носитель информации по п.52, причем упомянутое второе устройство связи содержит декодер речи, работающий в соответствии со второй схемой кодирования речи и выполненный с возможностью генерирования множества выборок звукового сигнала на основании, по меньшей мере, частично, остальных параметров кодирования сигнала измененного кадра, причем упомянутая первая схема кодирования речи отличается от упомянутой второй схемы кодирования речи.

54. Носитель информации, доступный для чтения с помощью компьютера, содержащий команды программы для выполнения функции функциональной совместимости интерфейса, содержащей операции, заключающиеся в том, что

вводят кадр, состоящий из множества параметров кодирования сигнала; и

удаляют, по меньшей мере, один параметр кодирования сигнала из кадра, состоящего из множества параметров кодирования сигнала, для формирования измененного кадра, причем, по меньшей мере, часть измененного кадра применима для генерирования множества выборок звукового сигнала.

55. Носитель информации по п.54, дополнительно содержащий операцию, заключающуюся в том, что передают упомянутый измененный кадр.

56. Носитель информации, доступный для чтения с помощью компьютера, содержащий команды программы для выполнения функции функциональной совместимости интерфейса, содержащей операции, заключающиеся в том, что

принимают кадр, состоящий из параметров кодирования сигнала; и увеличивают содержимое кадра, по меньшей мере, с помощью одной из операций вставки, по меньшей мере, одного произвольного параметра кодирования сигнала и копирования, по меньшей мере, одного из параметров кодирования сигнала.

57. Кодер речи, выполненный с возможностью работы в соответствии с первой схемой кодирования речи, содержащий средство, предназначенное для кодирования, по меньшей мере, одного неактивного речевого кадра, по меньшей мере, в один закодированный кадр, причем, по меньшей мере, часть, по меньшей мере, одного закодированного кадра является передаваемой в средство декодера речи и является непосредственно используемой средством декодера речи, причем упомянутое средство декодера речи работает в соответствии со второй схемой кодирования речи, отличной от упомянутой первой схемы кодирования речи.

58. Кодер речи по п.57, в котором, по меньшей мере, часть упомянутого, по меньшей мере, одного закодированного кадра, непосредственно используемая средством декодера речи, содержит, по меньшей мере, один параметр иммитанса спектральной частоты.

59. Декодер речи, выполненный с возможностью работы в соответствии с первой схемой кодирования речи, причем упомянутый декодер речи содержит средство, предназначенное для декодирования, по меньшей мере, одного неактивного речевого кадра, имеющего параметры кодирования сигнала, которые были сгенерированы с помощью средства кодера речи, действующего в соответствии со второй схемой кодирования речи, отличной от упомянутой первой схемы кодирования речи.

60. Декодер речи, содержащий

средство, предназначенное для приема кадра, состоящего из параметров кодирования сигнала, причем, по меньшей мере, один параметр кодирования сигнала произвольно сгенерирован для компенсации, по меньшей мере, одного ранее удаленного параметра кодирования сигнала; и

средство, предназначенное для декодирования параметров кодирования сигнала для вывода восстановленного речевого сигнала.

61. Декодер речи, содержащий

средство, предназначенное для приема, по меньшей мере, одного кадра, состоящего из параметров кодирования сигнала,

средство, предназначенное для обработки кадра, который включает в себя, по меньшей мере, один параметр кодирования сигнала, который был вставлен в исходный кадр с более низкой скоростью передачи, для формирования кадра с более высокой скоростью передачи, который принимается; и

средство, предназначенное для декодирования параметров кодирования сигнала для вывода восстановленного речевого сигнала.

62. Декодер речи по п.61, в котором кадр с более низкой скоростью передачи является кадром с половинной скоростью передачи, а кадр с более высокой скоростью передачи является кадром с полной скоростью передачи.



 

Похожие патенты:

Изобретение относится к области кодирования. .

Изобретение относится к области анализа и распознавания речевых сигналов. .

Изобретение относится к области анализа и распознавания речевых сигналов и касается способа распознавания фонем речи. .

Изобретение относится к системам сжатия аудиосигнала, в частности, к системам классификации речи/шума при сжатии аудиосигнала. .

Изобретение относится к обработке информации и может быть использовано в телекоммуникационных системах. .

Изобретение относится к обработке информации и может быть использовано в телекоммуникационных системах. .

Изобретение относится к области передачи сигналов

Изобретение относится к кодированию речи и более конкретно к проблеме разреженности в кодированных речевых сигналах

Изобретение относится к методу анализа речи, обнаруживающему частоту основного тона голоса, а также к методу обнаружения эмоций, оценивающему эмоцию на основании частоты основного тона голоса

Изобретение относится к обработке речевых сигналов

Изобретение относится к области анализа речевых сигналов, а именно к анализу и разложению на составляющие джиттера периода основного тона речевого сигнала

Изобретение относится к оценке периода основного тона в аудиосигналах

Изобретение относится к области психофизиологии, а именно к психофизиологии речи, и может быть использовано при анализе характеристик голосового аппарата человека для диагностики различных видов патологии голосоведения и объективной оценки эффективности проведения лечения

Изобретение относится к обработке аудиосигналов, в частности к измерению воспринимаемой громкости аудиосигнала
Наверх