Устройство кодирования стереофонических сигналов, устройство декодирования стереофонических сигналов и реализуемые ими способы

Авторы патента:

МОРИИ Тосиюки (JP)

G10L198 - Анализирование или синтезирование речи; распознавание речи (ввод/вывод звука для компьютеров G06F 3/16; способы или устройства для обработки цифровых данных, специально предназначенных для манипулирования данными на естественном языке G06F 17/20; обучение или общение со слепыми, глухими или немыми G09B 21/00; телефонная связь H04M)

Владельцы патента RU 2484542:

ПАНАСОНИК КОРПОРЭЙШН (JP)

Изобретение относится к устройствам и способам кодирования и декодирования, которые используются для того, чтобы кодировать стереофоническую речь. Техническим результатом является обеспечение масштабируемого кодирования на основе корреляции между сигналами левого и правого каналов и значимости информации и задания слоев для выполнения монофонического и стереофонического кодирования. Устройство кодирвоания стереофонических сигналов настоящего изобретения использует конфигурацию, имеющую: модуль вычисления суммы и разности, формирующий монофонический сигнал, связанный с суммой левого и правого сигналов, формирующих стереофонический сигнал, и формирует боковой сигнал, связанный с разностью между сигналами левого и правого каналов; модуль формирования информации режима, формирующий информацию режима в расчете на слой, указывающую режим кодирования одного из монофонического и стереофонического кодирования; модули кодирования слоев с первого по N-й, выполняющие монофоническое кодирование в i-м слое (i=1, 2, …, N, где N - целое число, большее или равное 2) с помощью информации, связанной с монофоническим сигналом, или выполняют стереофоническое кодирование в i-м слое с помощью информации, связанной с монофоническим и боковым сигналами, на основе информации режима и предоставляют кодированную информацию i-го слоя. 4 н. и 9 з.п. ф-лы, 20 ил.

Область техники, к которой относится изобретение

Настоящее изобретение относится к устройству кодирования стереофонических сигналов, устройству декодирования стереофонических сигналов и способам кодирования и декодирования, которые используются для того, чтобы кодировать стереофоническую речь.

Предшествующий уровень техники

В мобильной связи кодирование со сжатием для цифровой информации по речи и изображениям является важнейшим для эффективного использования полос частот передачи. В частности, с технологиями речевого кодека (кодирования и декодирования), широко используемыми в мобильных телефонах, связаны большие ожидания, и постоянно растет потребность в дополнительно повышенном качестве звука при традиционном высокоэффективном кодировании с высокой эффективностью сжатия.

В последнее время с расширением полосы пропускания сетей связи возникает потребность в реализации и высоком качестве звука в речевой связи, и для того, чтобы удовлетворять этой потребности, разработаны системы речевой связи с использованием технологий кодирования стереофонической речи.

В качестве способа кодирования стереофонической речи предусмотрен известный традиционный способ обнаружения монофонического и бокового сигналов и кодирования этих сигналов, при этом монофонический сигнал - это сумма сигнала левого канала и сигнала правого канала, и при этом боковой сигнал - это разность между сигналом левого канала и сигналом правого канала (см. патентный документ 1).

Сигнал левого канала и сигнал правого канала представляют звук, который прослушивают левое и правое ухо человека, монофонический сигнал может представлять общие элементы между сигналом левого канала и сигналом правого канала, а боковой сигнал может представлять пространственную разность между сигналом левого канала и сигналом правого канала.

Имеется высокая корреляция между сигналом левого канала и сигналом правого канала. Следовательно, по сравнению со случаем, когда сигнал правого канала и сигнал левого канала кодируются непосредственно, можно выполнять более надлежащее кодирование в соответствии с признаками монофонического сигнала и бокового сигнала посредством преобразования сигнала правого канала и сигнала левого канала в монофонический и боковой сигнал и последующего кодирования этих преобразованных сигналов так, что можно реализовывать кодирование с меньшей избыточностью, низкой битовой скоростью (битрейтом) и высоким качеством.

В последнее время стандартизация масштабируемого кодека, имеющего многослойную конфигурацию, изучается, например, в ITU-T (сектор стандартизации связи международного союза по телекоммуникациям) и MPEG (экспертная группа по киноизображению), и более эффективный и более высококачественный речевой кодек требуется.

Например, масштабируемое устройство кодирования на основе ITU-T G.729.1 выполняет кодирование на основе рекомендации ITU-T G.729.1 на 8 кбит/с и посредством дополнительного кодирования улучшающего слоя может выполнять кодирование на двенадцати типах битрейтов, к примеру 8 кбит/с, 12 кбит/с, 14 кбит/с, 16 кбит/с, 18 кбит/с, 20 кбит/с, 22 кбит/с, 24 кбит/с, 26 кбит/с, 28 кбит/с, 30 кбит/с и 32 кбит/с. Эта масштабируемость реализуется посредством последовательного кодирования искажения при кодировании нижнего слоя в верхнем слое. Таким образом, масштабируемое устройство кодирования G.729.1 формируется с помощью одного базового слоя с битрейтом 8 кбит/с, одного улучшающего слоя с битрейтом 4 кбит/с и десяти улучшающих слоев с битрейтом 2 кбит/с.

Кроме того, в качестве технологии выполнения масштабируемого кодирования стереофонических сигналов предусмотрено устройство кодирования стереофонических сигналов, раскрытое в патентном документе 2. Это устройство кодирования стереофонических сигналов выражает дополнительную информацию для каждого слоя посредством заранее определенного числа битов и с помощью заранее определенной вероятностной модели выполняет арифметическое кодирование битовых последовательностей в порядке от старшей битовой последовательности к младшей битовой последовательности. Здесь, данное устройство кодирования стереофонических сигналов имеет признак переключения между сигналом левого канала и сигналом правого канала согласно заранее определенному правилу и кодирования этих сигналов.

Патентный документ 1. Выложенная заявка на патент (Япония) номер 2001-255892

Патентный документ 2. Выложенная заявка на патент (Япония) номер HEI11-317672

Сущность изобретения

Проблемы, разрешаемые изобретением

Тем не менее, как описано выше, устройство кодирования стереофонических сигналов, раскрытое в патентном документе 2, выполнено с возможностью переключаться между сигналом левого канала и сигналом правого канала согласно заранее определенному правилу и кодировать эти сигналы, т.е. это кодирование не зависит от корреляции между сигналом левого канала и сигналом правого канала и от значимости информации. Кроме того, имеется проблема в том, что, хотя предпочтительно задавать слой для выполнения монофонического кодирования и слой для выполнения стереофонического кодирования посредством пользовательских операций в устройстве кодирования стереофонических сигналов, которое выполняет масштабируемое кодирование, устройство кодирования стереофонических сигналов, раскрытое в патентном документе 2, не может поддерживать это задание.

Следовательно, цель настоящего изобретения заключается в том, чтобы предоставить устройство кодирования стереофонических сигналов, устройство декодирования стереофонических сигналов и способы кодирования и декодирования для выполнения масштабируемого кодирования на основе корреляции между сигналом левого канала и сигналом правого канала и значимости информации и для задания слоя для выполнения монофонического кодирования и слоя для выполнения стереофонического кодирования.

Средство решения проблемы

Устройство кодирования стереофонических сигналов настоящего изобретения использует конфигурацию, имеющую: модуль вычисления суммы и разности, который формирует монофонический сигнал, связанный с суммой сигнала первого канала и сигнала второго канала, формирующих стереофонический сигнал, и формирует боковой сигнал, связанный с разностью между сигналом первого канала и сигналом второго канала; модуль формирования информации режима, который формирует информацию режима в расчете на слой, указывающую режим кодирования одного из монофонического кодирования и стереофонического кодирования; и модули кодирования слоев с первого по N-й, которые выполняют монофоническое кодирование в i-м слое (i=1, 2, …, N, где N - это целое число, равное или превышающее 2) с помощью информации, связанной с монофоническим сигналом, или выполняют стереофоническое кодирование в i-м слое с помощью как информации, связанной с монофоническим сигналом, так и информации, связанной с боковым сигналом, на основе информации режима и предоставляют кодированную информацию i-го слоя.

Устройство декодирования стереофонических сигналов настоящего изобретения использует конфигурацию, имеющую: приемный модуль, который принимает информацию режима и кодированную информацию слоев с первого по N-й, обнаруживаемую посредством обработки кодирования в слоях с первого по N-й, причем информация режима указывает, какое из монофонического кодирования и стереофонического кодирования выполняется при обработке кодирования в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) устройства кодирования стереофонических сигналов, которое выполняет кодирование с использованием сигнала первого канала и сигнала второго канала, формирующих стереофонический сигнал; модули декодирования слоев с первого по N-й, которые выполняют монофоническое декодирование или стереофоническое декодирование с использованием кодированной информации i-го слоя на основе информации режима и предоставляют результат декодирования монофонического сигнала в i-м слое и результат декодирования бокового сигнала в i-м слое, причем монофонический сигнал связан с суммой сигнала первого канала и сигнала второго канала, а боковой сигнал связан с разностью между сигналом первого канала и сигналом второго канала; и модуль вычисления суммы и разности, который вычисляет декодированный сигнал первого канала и декодированный сигнал второго канала с использованием результата декодирования монофонического сигнала в N-м слое и результата декодирования бокового сигнала в N-м слое.

Способ кодирования настоящего изобретения включает в себя этапы: формирования монофонического сигнала, связанного с суммой сигнала первого канала и сигнала второго канала, формирующих стереофонический сигнал, и формирования бокового сигнала, связанного с разностью между сигналом первого канала и сигналом второго канала; формирования информации режима в расчете на слой, указывающей режим кодирования одного из монофонического кодирования и стереофонического кодирования; и выполнения монофонического кодирования в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) с помощью информации, связанной с монофоническим сигналом, или выполнения стереофонического кодирования в i-м слое с помощью как информации, связанной с монофоническим сигналом, так и информации, связанной с боковым сигналом, на основе информации режима и предоставления кодированной информации i-го слоя.

Способ декодирования настоящего изобретения включает в себя этапы: приема информации режима и кодированной информации слоев с первого по N-й, обнаруживаемой посредством обработки кодирования в слоях с первого по N-й, причем информация режима указывает, какое из монофонического кодирования и стереофонического кодирования выполняется при обработке кодирования в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) устройства кодирования стереофонических сигналов, которое выполняет кодирование с использованием сигнала первого канала и сигнала второго канала, формирующих стереофонический сигнал; выполнения монофонического декодирования или стереофонического декодирования с использованием кодированной информации i-го слоя на основе информации режима и предоставления результата декодирования монофонического сигнала в i-м слое и результата декодирования бокового сигнала в i-м слое, причем монофонический сигнал связан с суммой сигнала первого канала и сигнала второго канала, а боковой сигнал связан с разностью между сигналом первого канала и сигналом второго канала; и вычисления декодированного сигнала первого канала и декодированного сигнала второго канала с использованием результата декодирования монофонического сигнала в N-м слое и результата декодирования бокового сигнала в N-м слое.

Преимущества изобретения

Согласно настоящему изобретению, посредством выполнения масштабируемого кодирования монофонического сигнала (M-сигнала) и бокового сигнала (S-сигнала), вычисляемых из L-сигнала и R-сигнала стереофонического сигнала, и задания режима кодирования для каждого слоя в масштабируемом кодировании на основе информации режима можно выполнять масштабируемое кодирование, согласно корреляции между сигналом левого канала и сигналом правого канала и на основе значимости информации. Кроме того, согласно настоящему изобретению, можно задавать слой для выполнения монофонического кодирования и слой для выполнения стереофонического кодирования, так что можно повышать степень свободы в управлении точностью кодирования.

Краткое описание чертежей

Фиг.1 является блок-схемой, показывающей основные компоненты устройства кодирования стереофонических сигналов согласно варианту осуществления 1 настоящего изобретения;

Фиг.2 является блок-схемой, показывающей основные компоненты в модуле кодирования базового слоя согласно варианту осуществления 1 настоящего изобретения;

Фиг.3 иллюстрирует операции в случае, когда режим монофонического кодирования задается в модуле кодирования базового слоя согласно варианту осуществления 1 настоящего изобретения;

Фиг.4 иллюстрирует операции в случае, когда режим стереофонического кодирования задается в модуле кодирования базового слоя согласно варианту осуществления 1 настоящего изобретения;

Фиг.5 является блок-схемой, показывающей основные компоненты в модуле монофонического кодирования согласно варианту осуществления 1 настоящего изобретения;

Фиг.6 является блок-схемой последовательности операций способа, показывающей алгоритм поиска в модуле зонального поиска согласно варианту осуществления 1 настоящего изобретения;

Фиг.7 показывает пример спектра, представленного посредством импульсов, для которых выполняется поиск в модуле зонального поиска, согласно варианту осуществления 1 настоящего изобретения;

Фиг.8 является блок-схемой последовательности операций способа, показывающей предварительную обработку алгоритма поиска в модуле полного поиска согласно варианту осуществления 1 настоящего изобретения;

Фиг.9 является блок-схемой последовательности операций способа, показывающей поиск посредством алгоритма поиска модуля полного поиска согласно варианту осуществления 1 настоящего изобретения;

Фиг.10 иллюстрирует пример спектра, представленного посредством импульсов, для которых выполняется поиск в модуле зонального поиска и модуле полного поиска, согласно варианту осуществления 1 настоящего изобретения;

Фиг.11 является блок-схемой, показывающей основные компоненты в модуле монофонического декодирования согласно варианту осуществления 1 настоящего изобретения;

Фиг.12 является блок-схемой последовательности операций способа, показывающей алгоритм декодирования модуля декодирования спектра согласно варианту осуществления 1 настоящего изобретения;

Фиг.13 является блок-схемой, показывающей основные компоненты в модуле стереофонического кодирования согласно варианту осуществления 1 настоящего изобретения;

Фиг.14 иллюстрирует состояние, когда спектр M-сигнала и спектр S-сигнала интегрируются в модуле интегрирования согласно варианту осуществления 1 настоящего изобретения;

Фиг.15 иллюстрирует выделение битов в модуле кодирования спектра согласно варианту осуществления 1 настоящего изобретения;

Фиг.16 является блок-схемой, показывающей основные компоненты в модуле стереофонического декодирования согласно варианту осуществления 1 настоящего изобретения;

Фиг.17 является блок-схемой, показывающей основные компоненты устройства декодирования стереофонических сигналов согласно варианту осуществления 1 настоящего изобретения;

Фиг.18 является блок-схемой, показывающей основные компоненты в модуле декодирования базового слоя согласно варианту осуществления 1 настоящего изобретения;

Фиг.19 является блок-схемой, показывающей основные компоненты в модуле декодирования второго улучшающего слоя согласно варианту осуществления 1 настоящего изобретения; и

Фиг.20 является блок-схемой, показывающей основные компоненты устройства кодирования стереофонических сигналов согласно варианту осуществления 2 настоящего изобретения.

Оптимальный режим осуществления изобретения

Далее подробно пояснены варианты осуществления настоящего изобретения со ссылкой на прилагаемые чертежи.

Первый вариант осуществления

Фиг.1 является блок-схемой, показывающей основные компоненты устройства 100 кодирования стереофонических сигналов согласно варианту осуществления 1 настоящего изобретения. Описывается примерный случай, в котором устройство 100 кодирования стереофонических сигналов согласно варианту осуществления 1 настоящего изобретения предоставляет один базовый слой и три улучшающих слоя. Далее поясняется примерный случай, в котором стереофонический сигнал состоит из сигнала левого канала (в дальнейшем "L-сигнала") и сигнала правого канала (в дальнейшем "R-сигнала").

На фиг.1 устройство 100 кодирования стереофонических сигналов содержит модуль 101 вычисления суммы и разности, модуль 102 задания режима, модуль 103 кодирования базового слоя, модуль 104 кодирования первого улучшающего слоя, модуль 105 кодирования второго улучшающего слоя, модуль 106 кодирования третьего улучшающего слоя и модуль 107 мультиплексирования.

Модуль 101 вычисления суммы и разности вычисляет суммарный сигнал (т.е. монофонический сигнал, в дальнейшем "M-сигнал") и разностный сигнал (т.е. боковой сигнал, в дальнейшем "S-сигнал") с помощью L-сигнала и R-сигнала согласно следующим уравнениям 1 и 2 и выводит результаты в модуль 103 кодирования базового слоя. Здесь, L-сигнал и R-сигнал представляют звук, который прослушивают левое и правое ухо человека, M-сигнал может представлять общие элементы между L-сигналом и R-сигналом, а S-сигнал может представлять пространственную разность между L-сигналом и R-сигналом.

M_i=L_i+R_i … (уравнение 1)

S_i=L_i-R_i … (уравнение 2)

В уравнениях 1 и 2 нижний индекс "i" представляет номер выборки каждого сигнала, но сигналы могут представляться без "i".

Например, M_i-сигнал может быть записан просто как M-сигнал.

Информация режима для задания режима кодирования в модулях кодирования из модуля 103 кодирования базового слоя, модуля 104 кодирования первого улучшающего слоя, модуля 105 кодирования второго улучшающего слоя и модуля 106 кодирования третьего улучшающего слоя принимается в качестве ввода в модуле 102 задания режима посредством пользовательских операций и затем выводится в эти модули кодирования и модуль 107 мультиплексирования. Здесь, пользовательские операции включают в себя ввод с клавиатуры, DIP-переключателя и кнопки и загрузку с PC (персонального компьютера) и т.д.

Режим кодирования в каждом модуле кодирования соответствует режиму монофонического кодирования для кодирования только информации M-сигнала или режим стереофонического кодирования для кодирования как информации M-сигнала, так и информации S-сигнала. Здесь, "информация M-сигнала" типично относится к самому M-сигналу или искажению при кодировании, связанному с M-сигналом, в каждом слое. Кроме того, "информация S-сигнала" типично относится к самому S-сигналу или искажению при кодировании, связанному с S-сигналом в каждом слое.

Далее, режим кодирования в каждом слое показан с помощью каждого из битов информации режима. Таким образом, в битах значение "0" представляет режим монофонического кодирования, а значение "1" представляет режим стереофонического кодирования. Более конкретно, например, каждый из четырех битов информации режима используется для того, чтобы последовательно представлять режимы кодирования в модуле 103 кодирования базового слоя, модуле 104 кодирования первого улучшающего слоя, модуле 105 кодирования второго улучшающего слоя и модуле 106 кодирования третьего улучшающего слоя.

Например, информация четырехбитового режима "0000" означает, что монофоническое кодирование выполняется во всех слоях. В этом случае устройство 100 кодирования стереофонических сигналов может кодировать M-сигнал с максимальным качеством. Кроме того, например, информация режима "0011" означает, что режимом кодирования в модуле 103 кодирования базового слоя и модуле 104 кодирования первого улучшающего слоя является режим монофонического кодирования, а режимом кодирования в модуле 105 кодирования второго улучшающего слоя и модуле 106 кодирования третьего улучшающего слоя является режим стереофонического кодирования. Кроме того, например, информация режима "1111" означает, что стереофоническое кодирование выполняется во всех слоях. В этом случае устройство 100 кодирования стереофонических сигналов может кодировать M-сигнал и S-сигнал с равным взвешиванием. Таким образом, с помощью информации четырехбитового режима можно представлять шестнадцать типов режимов кодирования в четырех модулях кодирования.

В настоящем варианте осуществления информация режима, выводимая из модуля 102 задания режима, принимается в каждом модуле кодирования и модуле 107 мультиплексирования как идентичная входная информация четырехбитового режима. Дополнительно, каждый модуль кодирования проверяет только один бит из этих четырех входных битов, требуемых для того, чтобы задавать режим кодирования, и задает режим кодирования. Таким образом, в четырех битах входной информации режима модуль 103 кодирования базового слоя проверяет первый бит, модуль 104 кодирования первого улучшающего слоя проверяет второй бит, модуль 105 кодирования второго улучшающего слоя проверяет третий бит, а модуль 106 кодирования третьего улучшающего слоя проверяет четвертый бит.

Тем не менее, вместо ввода идентичной информации четырехбитового режима в каждом модуле кодирования, модуль 102 задания режима может заранее сортировать один бит, требуемый для того, чтобы задавать режим кодирования в каждом модуле кодирования, и выводить один бит в каждый модуль кодирования. Таким образом, в информации четырехбитового режима, модуль 102 задания режима может вводить только первый бит в модуле 103 кодирования базового слоя, только второй бит в модуле 104 кодирования первого улучшающего слоя, только третий бит в модуле 105 кодирования второго улучшающего слоя и только четвертый бит в модуле 106 кодирования третьего улучшающего слоя.

Кроме того, в любом из вышеописанных случаев информация режима, принимаемая в качестве ввода из модуля 102 задания режима в модуль 107 мультиплексирования, упоминается как информация четырехбитового режима.

В модуле 103 кодирования базового слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 102 задания режима. После задания режима монофонического кодирования в модуле 103 кодирования базового слоя модуль 103 кодирования базового слоя кодирует только M-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, и выводит результирующую монофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию базового слоя. Дополнительно, модуль 103 кодирования базового слоя находит и выводит искажение при кодировании базового слоя M-сигнала, принимаемого в качестве ввода из модуля 101 вычисления суммы и разности, в модуль 104 кодирования первого улучшающего слоя как информацию M-сигнала в базовом слое и выводит S-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, как есть в модуль 104 кодирования первого улучшающего слоя как информацию S-сигнала в базовом слое. Напротив, после задания режима стереофонического кодирования в модуле 103 кодирования базового слоя модуль 103 кодирования базового слоя кодирует как M-сигнал, так и S-сигнал, принимаемые в качестве ввода из модуля 101 вычисления суммы и разности, и выводит результирующую стереофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию базового слоя. Дополнительно, модуль 103 кодирования базового слоя находит искажения при кодировании базового слоя M- и S-сигналов, принимаемых в качестве ввода из модуля 101 вычисления суммы и разности, и выводит результаты в модуль 104 кодирования первого улучшающего слоя как информацию M-сигнала в базовом слое и информацию S-сигнала в базовом слое. Кроме того, модуль 103 кодирования базового слоя подробнее поясняется ниже.

В модуле 104 кодирования первого улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 102 задания режима. После задания режима монофонического кодирования в модуле 104 кодирования первого улучшающего слоя модуль 104 кодирования первого улучшающего слоя кодирует информацию M-сигнала в базовом слое, принимаемую в качестве ввода из модуля 103 кодирования базового слоя, и выводит результирующую монофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию первого улучшающего слоя. Дополнительно, с помощью информации M-сигнала в базовом слое, принимаемой в качестве ввода из модуля 103 кодирования базового слоя, модуль 104 кодирования первого улучшающего слоя находит и выводит искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, в модуль 105 кодирования второго улучшающего слоя как информацию M-сигнала в первом улучшающем слое и выводит информацию S-сигнала в базовом слое, принимаемую в качестве ввода из модуля 103 кодирования базового слоя, как есть в модуль 105 кодирования второго улучшающего слоя как информацию S-сигнала в первом улучшающем слое.

В отличие от этого, после задания режима стереофонического кодирования в модуле 104 кодирования первого улучшающего слоя модуль 104 кодирования первого улучшающего слоя кодирует как информацию M-сигнала в базовом слое, так и информацию S-сигнала в базовом слое, принимаемые в качестве ввода из модуля 103 кодирования базового слоя, и выводит результирующую стереофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию первого улучшающего слоя. Дополнительно, с помощью информации M-сигнала в базовом слое и информации S-сигнала в базовом слое, принимаемых в качестве ввода из модуля 103 кодирования базового слоя, модуль 104 кодирования первого улучшающего слоя находит и выводит искажения при кодировании первого улучшающего слоя, связанные с M- и S-сигналами, в модуль 105 кодирования второго улучшающего слоя как информацию M-сигнала в первом улучшающем слое и информацию S-сигнала в первом улучшающем слое. Кроме того, модуль 104 кодирования первого улучшающего слоя подробнее поясняется ниже.

В модуле 105 кодирования второго улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 102 задания режима. После задания режима монофонического кодирования в модуле 105 кодирования второго улучшающего слоя модуль 105 кодирования второго улучшающего слоя кодирует информацию M-сигнала в первом улучшающем слое, принимаемую в качестве ввода из модуля 104 кодирования первого улучшающего слоя, и выводит результирующую монофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию второго улучшающего слоя. Дополнительно, с помощью информации M-сигнала в первом улучшающем слое, принимаемой в качестве ввода из модуля 104 кодирования первого улучшающего слоя, модуль 105 кодирования второго улучшающего слоя находит и выводит искажение при кодировании второго улучшающего слоя, связанное с M-сигналом, в модуль 106 кодирования третьего улучшающего слоя как информацию M-сигнала во втором улучшающем слое и выводит информацию S-сигнала в первом улучшающем слое, принимаемую в качестве ввода из модуля 104 кодирования первого улучшающего слоя, как есть в модуль 106 кодирования третьего улучшающего слоя как информацию S-сигнала во втором улучшающем слое.

В отличие от этого, после задания режима стереофонического кодирования в модуле 105 кодирования второго улучшающего слоя модуль 105 кодирования второго улучшающего слоя кодирует как информацию M-сигнала в первом улучшающем слое, так и информацию S-сигнала в первом улучшающем слое, принимаемые в качестве ввода из модуля 104 кодирования первого улучшающего слоя, и выводит результирующую стереофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию второго улучшающего слоя. Дополнительно, с помощью информации M-сигнала в первом улучшающем слое и информации S-сигнала в первом улучшающем слое, принимаемых в качестве ввода из модуля 104 кодирования первого улучшающего слоя, модуль 105 кодирования второго улучшающего слоя находит и выводит искажения при кодировании второго улучшающего слоя, связанные с M- и S-сигналами, в модуль 106 кодирования третьего улучшающего слоя как информацию M-сигнала во втором улучшающем слое и информацию S-сигнала во втором улучшающем слое. Кроме того, модуль 105 кодирования второго улучшающего слоя подробнее поясняется ниже.

В модуле 106 кодирования третьего улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 102 задания режима. После задания режима монофонического кодирования в модуле 106 кодирования третьего улучшающего слоя модуль 106 кодирования третьего улучшающего слоя кодирует информацию M-сигнала во втором улучшающем слое, принимаемую в качестве ввода из модуля 105 кодирования второго улучшающего слоя, и выводит результирующую монофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию третьего улучшающего слоя.

В отличие от этого, после задания режима стереофонического кодирования в модуле 106 кодирования третьего улучшающего слоя модуль 106 кодирования третьего улучшающего слоя кодирует как информацию M-сигнала во втором улучшающем слое, так и информацию S-сигнала во втором улучшающем слое, принимаемые в качестве ввода из модуля 105 кодирования второго улучшающего слоя, и выводит результирующую стереофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию третьего улучшающего слоя. Кроме того, модуль 106 кодирования третьего улучшающего слоя подробнее поясняется ниже.

Модуль 107 мультиплексирования мультиплексирует информацию режима, принимаемую в качестве ввода из модуля 102 задания режима, кодированную информацию базового слоя, принимаемую в качестве ввода из модуля 103 кодирования базового слоя, кодированную информацию первого улучшающего слоя, принимаемую в качестве ввода из модуля 104 кодирования первого улучшающего слоя, кодированную информацию второго улучшающего слоя, принимаемую в качестве ввода из модуля 105 кодирования второго улучшающего слоя, и кодированную информацию третьего улучшающего слоя, принимаемую в качестве ввода из модуля 106 кодирования третьего улучшающего слоя, и формирует потоки битов, которые должны быть переданы в устройство декодирования стереофонических сигналов.

В устройстве 100 кодирования стереофонических сигналов модуль 103 кодирования базового слоя, модуль 104 кодирования первого улучшающего слоя и модуль 105 кодирования второго улучшающего слоя имеют идентичную конфигурацию и, следовательно, выполняют в основном идентичные операции, а отличаются друг от друга только своими входными сигналами и выходными сигналами. Модуль 106 кодирования третьего улучшающего слоя не требует конфигурации для нахождения искажения при кодировании и, следовательно, отличается от вышеуказанных трех модулей кодирования в части конфигурации. Таким образом, модуль 106 кодирования третьего улучшающего слоя использует конфигурацию с исключением модуля 303 монофонического декодирования, модуля 306 стереофонического декодирования, переключателя 307, сумматора 308, сумматора 309 и переключателя 310 из конфигурации, показанной на фиг.2. Что касается вышеуказанных трех модулей кодирования, имеющих идентичную конфигурацию, например модуль 103 кодирования базового слоя принимает в качестве ввода M-сигнал и S-сигнал; при выполнении монофонического кодирования выводит в модуль 104 кодирования первого улучшающего слоя искажение при кодировании базового слоя M-сигнала как информацию M-сигнала и сам S-сигнал как информацию S-сигнала; и при выполнении стереофонического кодирования выводит в модуль 104 кодирования первого улучшающего слоя искажение при кодировании базового слоя M-сигнала как информацию M-сигнала и искажение при кодировании базового слоя S-сигнала как информацию S-сигнала.

Кроме того, модуль 104 кодирования первого улучшающего слоя и модуль 105 кодирования второго улучшающего слоя: принимают в качестве ввода информацию M-сигнала в предыдущем слое и информацию S-сигнала в доступном слое; при выполнении монофонического кодирования выводят в модуль кодирования в последующем слое искажение при кодировании, обнаруживаемое посредством дополнительного кодирования информации M-сигнала в предыдущем слое, и саму информацию S-сигнала в предыдущем слое; и, при выполнении стереофонического кодирования, выводят в модуль кодирования в последующем слое искажение при кодировании, обнаруживаемое посредством дополнительного кодирования информации M-сигнала в предыдущем слое, и искажение при кодировании, обнаруживаемое посредством дополнительного кодирования S-сигнала в предыдущем слое. Далее, конфигурации и операции вышеуказанных модулей кодирования поясняются с использованием модуля 103 кодирования базового слоя в качестве примера.

Фиг.2 является блок-схемой, показывающей основные компоненты в модуле 103 кодирования базового слоя.

На фиг.2 модуль 103 кодирования базового слоя содержит переключатель 301, модуль 302 монофонического кодирования, модуль 303 монофонического декодирования, переключатель 304, модуль 305 стереофонического кодирования, модуль 306 стереофонического декодирования, переключатель 307, сумматор 308, сумматор 309, переключатель 310 и переключатель 311.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "0", переключатель 301 выводит M-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, в модуль 302 монофонического кодирования, а если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", выводит M-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, в модуль 305 стереофонического кодирования.

Модуль 302 монофонического кодирования выполняет кодирование (т.е. монофоническое кодирование) с помощью M-сигнала, принимаемого в качестве ввода из переключателя 301, и выводит результирующую монофоническую кодированную информацию в модуль 303 монофонического декодирования и переключатель 311. Кроме того, модуль 302 монофонического кодирования подробнее поясняется ниже.

Модуль 303 монофонического декодирования декодирует монофоническую кодированную информацию, принимаемую в качестве ввода из модуля 302 монофонического кодирования, и выводит результирующий декодированный сигнал (т.е. монофонический декодированный M-сигнал) в переключатель 307. Кроме того, модуль 303 монофонического декодирования подробнее поясняется ниже.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", переключатель 304 выводит S-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, в модуль 305 стереофонического кодирования.

Модуль 305 стереофонического кодирования выполняет кодирование (т.е. стереофоническое кодирование) с помощью M-сигнала, принимаемого в качестве ввода из переключателя 301, и S-сигнала, принимаемого в качестве ввода из переключателя 304, и выводит результирующую стереофоническую кодированную информацию в модуль 306 стереофонического декодирования и переключатель 311. Кроме того, модуль 305 стереофонического кодирования подробнее поясняется ниже.

Модуль 306 стереофонического декодирования декодирует стереофоническую кодированную информацию, принимаемую в качестве ввода из модуля 305 стереофонического кодирования, и выводит два результирующих декодированных сигнала, т.е. стереофонический декодированный M-сигнал и стереофонический декодированный S-сигнал, в переключатель 307 и сумматор 309, соответственно.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "0", переключатель 307 выводит монофонический декодированный M-сигнал, принимаемый в качестве ввода из модуля 303 монофонического декодирования, в сумматор 308, или если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", выводит стереофонический декодированный M-сигнал, принимаемый в качестве ввода из модуля 306 стереофонического декодирования, в сумматор 308.

Сумматор 308 вычисляет разность между M-сигналом, принимаемым в качестве ввода из модуля 101 вычисления суммы и разности, и одним из монофонического декодированного M-сигнала и стереофонического декодированного M-сигнала, принимаемого в качестве ввода из переключателя 307, как искажение при кодировании базового слоя M-сигнала. Дополнительно, сумматор 308 выводит это искажение при кодировании базового слоя M-сигнала в модуль 104 кодирования первого улучшающего слоя как информацию M-сигнала в базовом слое.

Сумматор 309 вычисляет разность между S-сигналом, принимаемым в качестве ввода из модуля 101 вычисления суммы и разности, и стереофоническим декодированным S-сигналом, принимаемым в качестве ввода из модуля 306 стереофонического декодирования, как искажение при кодировании базового слоя S-сигнала. Дополнительно, сумматор 309 выводит это искажение при кодировании базового слоя S-сигнала в переключатель 310.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "0", переключатель 310 выводит S-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, как есть в модуль 104 кодирования первого улучшающего слоя как информацию S-сигнала в базовом слое. Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", переключатель 310 выводит искажение при кодировании базового слоя S-сигнала, принимаемого в качестве ввода из сумматора 309, в модуль 104 кодирования первого улучшающего слоя как информацию S-сигнала в базовом слое.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "0", переключатель 311 выводит монофоническую кодированную информацию, принимаемую в качестве ввода из модуля 302 монофонического кодирования, в модуль 107 мультиплексирования как кодированную информацию базового слоя. Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", переключатель 311 выводит стереофоническую кодированную информацию, принимаемую в качестве ввода из модуля 305 стереофонического кодирования, в модуль 107 мультиплексирования как кодированную информацию базового слоя.

Фиг.3 иллюстрирует операции в случае, когда режим монофонического кодирования задается в модуле 103 кодирования базового слоя на основе значения "0" первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима.

Как показано на фиг.3, когда режим монофонического кодирования задается в модуле 103 кодирования базового слоя, модуль 305 стереофонического кодирования, модуль 306 стереофонического декодирования и сумматор 309 не работают, а модуль 302 монофонического кодирования и модуль 303 монофонического декодирования работают. Кроме того, сумматор 308 находит остаточный сигнал между монофоническим декодированным M-сигналом, принимаемым в качестве ввода из модуля 303 монофонического декодирования через переключатель 307, и M-сигналом, принимаемым в качестве ввода из модуля 101 вычисления суммы и разности, как искажение при кодировании базового слоя M-сигнала. Кроме того, переключатель 310 выводит S-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, как есть в модуль 104 кодирования первого улучшающего слоя. Переключатель 311 выводит монофоническую кодированную информацию, принимаемую в качестве ввода из модуля 302 монофонического кодирования, в модуль 107 мультиплексирования как кодированную информацию базового слоя.

Фиг.4 иллюстрирует операции в случае, когда режим стереофонического кодирования задается в модуле 103 кодирования базового слоя на основе значения "1" первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима.

Как показано на фиг.4, когда режим стереофонического кодирования задается в модуле 103 кодирования базового слоя, модуль 302 монофонического кодирования и модуль 303 монофонического декодирования не работают, а модуль 305 стереофонического кодирования, модуль 306 стереофонического декодирования и сумматор 309 работают. Кроме того, сумматор 308 находит остаточный сигнал между стереофоническим декодированным M-сигналом, принимаемым в качестве ввода из модуля 306 стереофонического декодирования, и M-сигналом, принимаемым в качестве ввода из модуля 101 вычисления суммы и разности, как искажение при кодировании базового слоя M-сигнала. Кроме того, переключатель 310 выводит искажение при кодировании базового слоя S-сигнала, принимаемого в качестве ввода из сумматора 309, в модуль 104 кодирования первого улучшающего слоя. Переключатель 311 выводит стереофоническую кодированную информацию, принимаемую в качестве ввода из модуля 305 стереофонического кодирования, в модуль 107 мультиплексирования как кодированную информацию базового слоя.

Фиг.5 является блок-схемой, показывающей основные компоненты в модуле 302 монофонического кодирования.

На фиг.5 модуль 302 монофонического кодирования содержит модуль 321 анализа LPC (коэффициентов линейного прогнозирования), модуль 322 LPC-квантования, модуль 323 LPC-деквантования, обратный (инверсный) фильтр 324, модуль 325 MDCT (модифицированного дискретного косинусного преобразования), модуль 326 кодирования спектра и модуль 327 мультиплексирования. Модуль 326 кодирования спектра включает в себя модуль 111 квантования по форме и модуль 112 квантования по усилению, а модуль 111 квантования по форме включает в себя модуль 121 зонального поиска и модуль 122 полного поиска.

Модуль 321 LPC-анализа выполняет анализ с линейным прогнозированием с использованием M-сигнала, принимаемого в качестве ввода из модуля 101 вычисления суммы и разности через переключатель 301, и предоставляет и выводит LPC-параметры (т.е. параметры линейного прогнозирования), указывающие структуру спектра M-сигнала, в модуль 322 LPC-квантования.

Модуль 322 LPC-квантования преобразует параметры линейного прогнозирования, принимаемые в качестве ввода из модуля 321 LPC-анализа, в параметры с хорошей комплементарностью, такие как LSP (пары спектральных линий или пары спектральных линий) и ISP (пары спектральных иммитансов), и квантует преобразованные параметры посредством такого способа квантования, как VQ (векторное квантование), прогнозирующее VQ, многостадийное VQ и раздельное VQ. Модуль 322 LPC-квантования выводит LPC-квантованные данные, полученные посредством квантования, в модуль 323 LPC-деквантования и модуль 327 мультиплексирования.

Модуль 323 LPC-деквантования деквантует LPC-квантованные данные, принимаемые в качестве ввода из модуля 322 LPC-квантования, и дополнительно инвертирует результирующие параметры, такие как LSP и ISP, в LPC-параметры.

Обратный фильтр 324 применяет обратную фильтрацию к M-сигналу, принимаемому в качестве ввода из модуля 101 вычисления суммы и разности через переключатель 301, с использованием LPC-параметров, принимаемых в качестве ввода из модуля 323 LPC-деквантования, и выводит в MDCT-модуль 325 фильтрованный M-сигнал, в котором конкретная для спектра структура удаляется и изменяется на плоскую форму. Здесь, функция обратного фильтра 324 представляется посредством следующего уравнения 3.

[1]

… (уравнение 3)

В уравнении 3 нижний индекс i представляет номер выборки каждого сигнала, x_i представляет входной сигнал обратного фильтра 324, а y_i представляет выходной сигнал обратного фильтра 324. Кроме того, α_i представляет LPC-параметры, квантованные и деквантованные в модуле 322 LPC-квантования и модуле 323 LPC-деквантования, а J представляет порядок линейного прогнозирования.

MDCT-модуль 325 выполняет MDCT M-сигнала, подвергнутого обратной фильтрации, принимаемого в качестве ввода из обратного фильтра 324, и преобразует M-сигнал временной области в спектр M-сигнала частотной области. Кроме того, вместо MDCT в равной степени можно использовать FFT (быстрое преобразование Фурье). MDCT-модуль 325 выводит спектр M-сигнала, полученный посредством MDCT, в модуль 326 кодирования спектра.

Модуль 326 кодирования спектра принимает спектр M-сигнала в качестве ввода из MDCT-модуля 325, квантует спектральную форму и усиление входного спектра отдельно и выводит результирующий импульсный код и код усиления в модуль 327 мультиплексирования. Модуль 111 квантования по форме квантует форму входного спектра в позициях и полярностях небольшого числа импульсов, и модуль 112 квантования по усилению вычисляет и квантует усиления импульсов, для которых выполняется поиск в модуле 111 квантования по форме, на основе каждой полосы частот. Модуль 326 кодирования спектра выводит импульсный код, указывающий позиции и полярности искомых импульсов, и код усиления, представляющий усиление искомых импульсов, в модуль 327 мультиплексирования. Кроме того, модуль 111 квантования по форме и модуль 112 квантования по усилению подробнее поясняются ниже.

Модуль 327 мультиплексирования предоставляет монофоническую кодированную информацию посредством мультиплексирования LPC-квантованных данных, принимаемых в качестве ввода из модуля 322 LPC-квантования, и импульсного кода и кода усиления, принимаемых в качестве ввода из модуля 326 кодирования спектра, и выводит монофоническую кодированную информацию в модуль 303 монофонического декодирования и переключатель 311.

Далее подробнее поясняются модуль 111 квантования по форме и модуль 112 квантования по усилению. Модуль 111 квантования по форме включает в себя модуль 121 зонального поиска, который выполняет поиск импульсов в каждой из множества из полос частот, на которые заранее определенная зона поиска разделяется, и модуль 122 полного поиска, который выполняет поиск импульсов по всей зоне поиска.

Следующее уравнение 4 предоставляет исходную точку поиска. Здесь, в уравнении 4, E представляет искажение при кодировании, s_i представляет входной спектр, g представляет оптимальное усиление, δ - это дельта-функция, а p представляет позицию импульса.

[2]

… (уравнение 4)

Из вышеприведенного уравнения 4 позицией импульса для того, чтобы минимизировать функцию затрат, является позиция, в которой абсолютное значение |sp| входного спектра в каждой полосе частот является максимальным, а полярность имеет значение входного спектра в этой позиции импульса.

Ниже поясняется примерный случай, в котором длина вектора входного спектра составляет восемьдесят выборок, число полос частот составляет пять, и спектр кодируется с помощью всего восьми импульсов, состоящих из одного импульса в расчете на полосу частот и трех импульсов во всей зоне. В этом случае длина каждой полосы частот составляет шестнадцать выборок. Дополнительно, амплитуда импульсов, для которых следует выполнять поиск, задается фиксированно равной "1", а их полярность является "+" или "-".

Модуль 121 зонального поиска выполняет поиск позиции максимальной энергии и ее полярности (+/-) в каждой полосе частот и дает возможность появляться одному импульсу в расчете на полосу частот. В этом примере число полос частот пять, и каждая полоса частот требует четырех битов, чтобы показывать позицию импульса (записи позиций: 16), и один бит, чтобы показывать полярность (+/-), требуя всего 25 информационных битов.

Последовательность операций алгоритма поиска модуля 121 зонального поиска показана на фиг.6. Здесь, символы, используемые на блок-схеме последовательности операций способа фиг.6, означают следующее:

i: позиция

b: номер полосы частот

max: максимальное значение

c: счетчик

pos[b]: результат поиска (позиция)

pol[b]: результат поиска (полярность)

s[i]: входной спектр

Как показано на фиг.6, модуль 121 зонального поиска вычисляет входной спектр s[i] каждой выборки (0≤c≤15) в расчете на полосу частот (0≤b≤4) и вычисляет максимальное значение "max".

Фиг.7 показывает пример спектра, представленного посредством импульсов, для которых выполняется поиск в модуле 121 зонального поиска. Как показано на фиг.7, один импульс, имеющий амплитуду "1" и полярность "+" или "-", размещается в каждой из пяти полос частот, каждая из которых имеет полосу пропускания в шестнадцать выборок.

Модуль 122 полного поиска выполняет поиск позиций, чтобы размещать три импульса, по всей зоне поиска и кодирует позиции импульсов и их полярности. В модуле 122 полного поиска поиск выполняется согласно следующим четырем условиям для кодирования точных позиций с небольшим числом информационных битов и небольшим объемом вычислений.

(1) Два или более импульсов не размещаются в одной позиции. В этом примере импульсы не размещаются в позициях, в которых импульс каждой полосы частот размещается в модуле 121 зонального поиска. С помощью данного изобретения информационные биты не используются для того, чтобы представлять амплитудные компоненты, так что можно эффективно использовать информационные биты.

(2) Поиск импульсов выполняется по порядку, один за другим, в разомкнутом контуре. Во время поиска, согласно правилу (1), определенные позиции импульсов не подлежат поиску.

(3) При поиске позиции позиция, в которой импульс менее предпочтительно должен размещаться, также кодируется как информация позиции один.

(4) С учетом того, что усиление кодируется на основе каждой полосы частот, поиск импульсов выполняется посредством оценки искажения при кодировании относительно идеального усиления каждой полосы частот.

Модуль 122 полного поиска выполняет следующую двухэтапную оценку затрат, чтобы выполнять поиск одиночного импульса по всему входному спектру. Во-первых, на первом этапе, модуль 122 полного поиска оценивает затраты в каждой полосе частот и находит позицию и полярность так, чтобы минимизировать функцию затрат. Затем, на второй стадии, модуль 122 полного поиска оценивает полные затраты каждый раз, когда вышеуказанный поиск завершен в полосе частот, и сохраняет позицию и полярность импульса, чтобы минимизировать затраты, как конечный результат. Этот поиск выполняется в расчете на полосу частот, по порядку. Дополнительно, этот поиск выполняется для того, чтобы удовлетворять вышеуказанным условиям (1)-(4). Затем, когда поиск одного импульса завершен, при условии присутствия этого импульса в искомой позиции, поиск следующего импульса выполняется. Этот поиск выполняется до тех пор, пока заранее определенного числа импульсов (три импульса в этом примере) не обнаружено, посредством повторения вышеуказанной обработки.

Последовательность операций алгоритма поиска в модуле 122 полного поиска показана на фиг.8.

Фиг.8 является блок-схемой последовательности операций способа предварительной обработки поиска, а фиг.9 является блок-схемой последовательности операций способа поиска. Дополнительно, части, соответствующие вышеуказанным условиям (1), (2) и (4), показаны на блок-схеме последовательности операций способа фиг.9.

Символы, используемые на блок-схеме последовательности операций способа фиг.8, означают следующее:

c: счетчик

pf[*]: флаг присутствия/отсутствия импульса

b: номер полосы частот

pos[*]: результат поиска (позиция)

n_s[*]: значение корреляции

n_max[*]: максимальное значение корреляции

n2_s[*]: значение квадрата корреляции

n2_max[*]: максимальное значение квадрата корреляции

d_s[*]: значение мощности

d_max[*]: максимальное значение мощности

s[*]: входной спектр

Символы, используемые на блок-схеме последовательности операций способа фиг.9, означают следующее:

i: номер импульса

i0: позиция импульса

cmax: максимальное значение функции затрат

pf[*]: флаг присутствия/отсутствия импульса (0: отсутствие, 1: присутствие)

ii0: относительная позиция импульса в полосе частот

nom: спектральная амплитуда

nom2: член числителя (спектральная мощность)

den: член знаменателя

n_s[*]: относительное значение

d_s[*]: значение мощности

s[*]: входной спектр

n2_s[*]: значение квадрата корреляции

n_max[*]: максимальное значение корреляции

n2_max[*]: максимальное значение квадрата корреляции

idx_max[*]: результат поиска каждого импульса (позиция) (здесь, idx_max[*] от 0 до 4 эквивалентно pos[b] на фиг.6)

fd0, fd1, fd2: буфер для временного хранения (тип вещественных чисел)

id0, id1: буфер для временного хранения (тип целых чисел)

id0_s, id1_s: буфер для временного хранения (тип целых чисел)

>>: битовый сдвиг (вправо)

&: "и" как битовая последовательность

Здесь, при поиске на фиг.8 и фиг.9, случай, в котором idx_max[*] равно "-1", соответствует случаю вышеуказанного условия (3), когда импульс менее предпочтительно должен размещаться. Конкретным примером этого является то, когда спектр достаточно аппроксимируется только с помощью импульсов, для которых выполняется поиск в расчете на полосу частот, и импульсов, для которых выполняется поиск по всей зоне, и когда дополнительное прибавление импульсов с идентичной величиной пропорционально увеличивает искажение при кодировании.

Полярности искомых импульсов соответствуют полярностям входного спектра в этих позициях, и модуль 122 полного поиска кодирует эти полярности с помощью 3 (импульсов) × 1=3 битов. Здесь, когда позиция - это "-1", т.е. когда импульс не должен размещаться, любая полярность может использоваться. Тем не менее, полярность может использоваться для того, чтобы обнаруживать битовую ошибку, и, в общем, задается фиксированно равной "+" или "-".

Дополнительно, модуль 122 полного поиска кодирует информацию позиций импульсов на основе числа комбинаций позиций импульсов. В этом примере, поскольку входной спектр содержит восемьдесят выборок, и пять импульсов уже обнаружены в пяти отдельных полосах частот, если случаи, в которых импульсы не размещаются, также принимаются во внимание, варьирования позиций могут представляться с помощью семнадцати битов посредством вычисления следующего уравнения 5.

[3]

75+1C3=(75+1)*(74+1)*(73+1)/3/2/1

=70300

<131072

=2^17 … (уравнение 5)

Здесь, согласно правилу запрета размещения двух или более импульсов в одной позиции можно сокращать число комбинаций, так что эффект этого правила становится большим, когда число импульсов, для которых выполняется полный поиск, увеличивается.

Способ кодирования позиций импульсов, для которых выполняется поиск в модуле 122 полного поиска, описывается ниже подробно.

(1) Три позиции импульсов сортируются на основе своей величины и размещаются в порядке от наименьшего числового значения к наибольшему числовому значению. Здесь, "-1" - это влево, как есть.

(2) Номера импульсов выровнены по левой границе посредством числа импульсов, возникающих в отдельных полосах частот, чтобы уменьшать числовые значения позиций импульсов. Числовые значения, вычисляемые таким образом, упоминаются "как номера позиций". Здесь, "-1" - это влево, как есть. Например, при обращении к позиции импульса "66", когда по одному импульсу предоставляется между 0 и 15, между 16 и 31, между 32 и 47 и между 48 и 64, номер позиции изменяется на "66-4=62".

(3) "-1" задается равным номеру позиции, представленному посредством "максимального значения импульса+1". В этом случае порядок значений регулируется и определяется так, что заданный номер позиции не путается с номером позиции, в котором фактически присутствует импульс. Посредством этого номер импульса для импульса #0 ограничен диапазоном 0-73, номер позиции для импульса #1 ограничен диапазоном между номером позиции для импульса #0-74, а номер позиции для импульса #2 ограничен диапазоном между номером позиции для импульса #1-75, т.е. номер позиции меньшего импульса сконфигурирован не превышать номер позиции большего импульса.

(4) Затем, согласно обработке интегрирования, показанной в следующем уравнении 6, чтобы вычислять комбинированный код, номера позиций (i0, i1, i2) интегрируются, чтобы формировать код (c). Эта обработка интегрирования упоминается как обработка вычисления интегрирования всех комбинаций в случае, когда имеется порядок величины.

[4]

c=((76-0)*(77-0)*(153-2*0)/3+(74-0)*(75-0))/4

-((76-i0)*(77-i0)*(153-2*i0)/3+(74-i0)*(75-i0))/4;

c=c+(76-i0)*(77-i0)/2-(76-i1)*(77-i1)/2;

c=c+75-i2; … (уравнение 6)

(5) Затем, посредством комбинирования семнадцати битов этого c и трех битов для полярности код из двадцати битов формируется.

Здесь, в вышеуказанных номерах позиций, импульс #0 в "73", импульс #1 в "74" и импульс #2 в "75" являются номерами позиций, в которых импульсы не размещаются. Например, если имеется три номера позиций (73,-1,-1) согласно вышеуказанной взаимосвязи между номером позиции один и номером позиции, в которой импульс не размещается, эти номера позиций переупорядочиваются как (-1, 73,-1) и становятся следующими (73, 73, 74).

Таким образом, с помощью модели для того, чтобы представлять входной спектр посредством последовательности из восьми импульсов (пять импульсов в отдельных полосах частот и три импульса во всей зоне), как показано в этом примере, можно выполнять кодирование посредством 45 информационных битов.

Фиг.10 иллюстрирует пример спектра, представленного посредством импульсов, для которых выполняется поиск в модуле 121 зонального поиска и модуле 122 полного поиска. Кроме того, на фиг.10 импульсы, представленные посредством полужирных линий, являются импульсами, для которых выполняется поиск в модуле 122 полного поиска.

Модуль 112 квантования по усилению квантует усиление каждой полосы частот. Восемь импульсов размещаются в полосах частот, и модуль 112 квантования по усилению вычисляет усиления посредством анализа корреляции между этими импульсами и входным спектром.

Если модуль 112 квантования по усилению вычисляет идеальные усиления и затем выполняет кодирование посредством скалярного или векторного квантования, во-первых, модуль 112 квантования по усилению вычисляет идеальные усиления согласно следующему уравнению 7. Здесь, в уравнении 7, gn - это идеальное усиление полосы частот n, s(i+16n) - это входной спектр полосы частот n, vn(i)- это вектор, обнаруживаемый посредством декодирования формы полосы частот n.

[5]

… (уравнение 7)

Дополнительно, модуль 112 квантования по усилению выполняет кодирование посредством совместного выполнения скалярного квантования (SQ) идеальных усилений или совместного выполнения векторного квантования этих пяти усилений. В случае выполнения векторного квантования можно выполнять эффективное кодирование посредством прогнозирующего квантования, многостадийного VQ, раздельного VQ и т.д. Здесь, усиление может прослушиваться перцепционно на основе логарифмического масштаба, и, следовательно, посредством выполнения SQ или VQ после выполнения логарифмического преобразования усиления можно предоставлять перцепционно хороший синтезирующий звук.

Дополнительно, вместо вычисления идеальных усилений, предусмотрен способ прямой оценки искажения при кодировании. Например, в случае выполнения VQ для пяти усилений искажение при кодировании вычисляется так, чтобы минимизировать следующее уравнение 8. Здесь, в уравнении 8, E_k - это искажение вектора k-го усиления, s(i+16n) - это входной спектр полосы частот n, g(k)n - это n-й элемент вектора k-го усиления, а vⁿ(i) - это вектор формы, обнаруживаемый посредством декодирования формы полосы частот n.

[6]

… (уравнение 8)

Фиг.11 является блок-схемой, показывающей основные компоненты в модуле 303 монофонического декодирования. Модуль 303 монофонического декодирования, показанный на фиг.11, содержит модуль 331 демультиплексирования, модуль 332 LPC-деквантования, модуль 333 декодирования спектра, модуль 334 IMDCT (обратного модифицированного дискретного косинусного преобразования) и синтезирующий фильтр 335.

На фиг.11 модуль 331 демультиплексирования демультиплексирует монофоническую кодированную информацию, принимаемую в качестве ввода из модуля 302 монофонического кодирования, в LPC-квантованные данные, импульсный код и код усиления, выводит LPC-квантованные данные в модуль 332 LPC-деквантования и выводит импульсный код и код усиления в модуль 333 декодирования спектра.

Модуль 332 LPC-деквантования деквантует LPC-квантованные данные, принимаемые в качестве ввода из модуля 331 демультиплексирования, и выводит результирующие LPC-параметры в синтезирующий фильтр 335.

Модуль 333 декодирования спектра декодирует вектор формы и усиление при декодировании посредством способа, поддерживающего способ кодирования в модуле 326 кодирования спектра, показанном на фиг.5, с помощью импульсного кода и кода усиления, принимаемых в качестве ввода из модуля 331 демультиплексирования. Дополнительно, модуль 333 декодирования спектра предоставляет декодированный спектр посредством умножения декодированного вектора формы на усиление при декодировании и выводит этот декодированный спектр в IMDCT-модуль 334.

IMDCT-модуль 334 преобразует декодированный спектр, принимаемый в качестве ввода из модуля 333 декодирования спектра, противоположным способом относительно преобразования в MDCT-модуле 325, показанном на фиг.5, и выводит M-сигнал временных рядов, обнаруживаемый посредством преобразования, в синтезирующий фильтр 335.

Синтезирующий фильтр 335 предоставляет монофонический декодированный M-сигнал посредством применения синтезирующего фильтра к M-сигналу временных рядов, принимаемому в качестве ввода из IMDCT-модуля 334, при использовании LPC-параметров, принимаемых в качестве ввода из модуля 332 LPC-деквантования.

Далее поясняется способ декодирования трех импульсов в модуле 333 декодирования спектра, для которых выполняется полный поиск.

В модуле 122 полного поиска из модуля 326 кодирования спектра номера позиций (i0, i1, i2) интегрируются в один код с помощью вышеприведенного уравнения 5. В модуле 333 декодирования спектра выполняется противоположная обработка. Таким образом, модуль 333 декодирования спектра последовательно вычисляет значение уравнения интегрирования при изменении каждого номера позиции, фиксированно задает номер позиции, когда номер позиции меньше значения интегрирования, и выполняет декодирование посредством выполнения этой обработки от номера позиции нижнего слоя до номера позиции высшего порядка один за другим. Фиг.12 является блок-схемой последовательности операций способа, показывающей алгоритм декодирования модуля 333 декодирования спектра.

Дополнительно, на фиг.12, когда введенный код "k" интегрированной позиции заключает в себе ошибку вследствие битовой ошибки, последовательность операций переходит к этапу обработки ошибок. Следовательно, в этом случае позиция должна быть обнаружена посредством заранее определенной обработки ошибок.

Дополнительно, поскольку декодер выполняет контурную обработку, объем вычислений в декодере больше, чем в кодере. Здесь, каждый контур является разомкнутым контуром, и, следовательно, по сравнению с общим объемом обработки в устройстве кодирования объем вычислений в декодере не является настолько большим.

Фиг.13 является блок-схемой, показывающей основные компоненты в модуле 305 стереофонического кодирования. Модуль 305 стереофонического кодирования, показанный на фиг.13, имеет в основном идентичную конфигурацию и выполняет в основном операции, идентичные модулю 302 монофонического кодирования, показанному на фиг.5. Следовательно, что касается модулей, которые выполняют идентичные операции для фиг.5 и фиг.13, "a" назначается ссылкам с номерами модулей на фиг.13. Например, модуль на фиг.13, соответствующий модулю 321 LPC-анализа на фиг.5, выражается как модуль 32a1 LPC-анализа. Кроме того, модуль 305 стереофонического кодирования на фиг.13 отличается от модуля 302 монофонического кодирования на фиг.5 включением дополнительного обратного фильтра 351, MDCT-модуля 352 и модуля 353 интегрирования. Кроме того, модуль 356 кодирования спектра из модуля 305 стереофонического кодирования на фиг.13 отличается от модуля 326 кодирования спектра из модуля 302 монофонического кодирования на фиг.5 входными сигналами, и, следовательно, ему назначается другая ссылка с номером.

Обратный фильтр 351 применяет обратную фильтрацию к S-сигналу, принимаемому в качестве ввода из модуля 101 вычисления суммы и разности, с использованием LPC-параметров, принимаемых в качестве ввода из модуля 323a LPC-деквантования, чтобы сглаживать конкретную для спектра структуру, и выводит фильтрованный S-сигнал в MDCT-модуль 352. Здесь, функция обратного фильтра 324a представляется посредством вышеприведенного уравнения 3. Строго говоря, хотя LPC-коэффициенты, полученные из M-сигнала, не совпадают со спектральной структурой S-сигнала с учетом того, что M-сигнал и S-сигнал, в общем, имеют аналогичные спектральные структуры и что объем вычислений и объем ROM, требуемый для LPC-анализа, квантования и деквантования S-сигнала, экономится, LPC-параметры, принимаемые в качестве ввода из модуля 323a LPC-деквантования, используются при обработке обратной фильтрации в обратном фильтре 351.

MDCT-модуль 352 выполняет MDCT S-сигнала, подвергнутого обратной фильтрации, принимаемого в качестве ввода из обратного фильтра 351, и преобразует S-сигнал временной области в спектр S-сигнала частотной области. Здесь, вместо MDCT в равной степени можно использовать FFT. MDCT-модуль 352 выводит спектр S-сигнала, обнаруживаемый посредством MDCT, в модуль 353 интегрирования.

Модуль 353 интегрирования интегрирует спектр M-сигнала, принимаемый в качестве ввода из MDCT-модуля 325a, и спектр S-сигнала, принимаемый в качестве ввода из MDCT-модуля 352 так, что спектры одной частоты являются смежными друг с другом, и выводит результирующий интегрированный спектр в модуль 356 кодирования спектра.

Фиг.14 иллюстрирует состояние, когда спектр M-сигнала и спектр S-сигнала интегрируются в модуле 353 интегрирования. Модуль 356 кодирования спектра использует интегрированный спектр, обнаруживаемый посредством интегрирования двух спектров, как показано на фиг.14, как один целевой спектр кодирования, и, следовательно, выделяет большее число битов важным частям при кодировании спектра M-сигнала и спектра S-сигнала.

Возвращаемся к фиг.13, модуль 356 кодирования спектра отличается от модуля 326 кодирования спектра использованием интегрированного спектра, принимаемого в качестве ввода из модуля 353 интегрирования, в качестве входного спектра. Кроме того, модуль 356 кодирования спектра отличается от модуля 326 кодирования спектра числом импульсов, для которых выполняется поиск по всему входному спектру.

В ассоциации с числом импульсов, для которых выполняется полный поиск, выделение битов в модуле 356 кодирования спектра поясняется в отношении фиг.15.

Модуль 356 кодирования спектра использует интегрированный спектр как входной спектр, и, следовательно, число выборок во входном спектре в два раза превышает число выборок во входном спектре в модуле 326 кодирования спектра, и число выборок в каждой из пяти полос частот, обнаруживаемых посредством деления входного спектра, в два раза превышает число выборок в модуле 326 кодирования спектра. С учетом того, что общее число битов кода формы составляет 45 битов в модуле 302 монофонического кодирования, модуль 356 кодирования спектра выполняет выделение битов, как показано на фиг.15. Как показано на фиг.15, число импульсов, для которых выполняется полный поиск, составляет "2" в модуле 356 кодирования спектра, что отличается от модуля 326 кодирования спектра, в котором число импульсов, для которых выполняется полный поиск, составляет "3".

Кроме того, как показано на фиг.15, число битов, которое следует использовать при кодировании спектра, составляет "46" всего в модуле 356 кодирования спектра, что отличается от модуля 326 кодирования спектра, в котором число битов, которое следует использовать при кодировании спектра, составляет "45" всего.

Здесь, в равной степени можно полностью сопоставлять общее число битов, которое следует использовать при кодировании спектра в модуле 356 кодирования спектра, с общим числом битов, которое следует использовать при кодировании спектра в модуле 326 кодирования спектра. Например, диапазон поиска для одного из двух импульсов, для которых выполняется полный поиск в модуле 356 кодирования спектра, может быть ограничен от 0-159 выборок до 0-50 выборок. Посредством этого можно выражать 160×51<8192 видов результатов поиска посредством 13 битов, так что можно подавлять общее число битов, которые следует использовать при кодировании спектра, пределами 45 битов. Альтернативно, например, после поиска импульса в расчете на полосу частот, посредством ограничения диапазона поиска пятой полосы частот (т.е. наивысшей полосы частот) от 0-31 выборки до 0-15 выборок, в равной степени можно полностью сопоставлять общее число битов, которое следует использовать при кодировании спектра в модуле 356 кодирования спектра, с общим числом битов, которое следует использовать при кодировании спектра в модуле 326 кодирования спектра. Это обусловлено тем, что в этом случае можно представлять позиции импульсов полосы частот в пяти полосах частот посредством 5×4+4=24 битов.

Если модуль 356 кодирования спектра кодирует интегрированный спектр, интегрирующий спектр M-сигнала и спектр S-сигнала, выделение битов автоматически выполняется на основе признаков M-сигнала и S-сигнала, так что можно выполнять эффективное кодирование согласно значимости информации.

Например, если L-сигнал и R-сигнал являются полностью идентичными, спектр S-сигнала равен "0", и импульсы размещаются только в позициях спектра M-сигнала в интегрированном спектре. Следовательно, спектр M-сигнала кодируется точно.

В отличие от этого, если фаза L-сигнала и фаза R-сигнала являются приблизительно противоположными, спектр S-сигнала становится значимым, и больше импульсов размещается в позициях спектра S-сигнала в интегрированном спектре. Следовательно, спектр S-сигнала кодируется точно. Таким образом, без специальной классификации на основе решений или случаев выделение битов выполняется автоматически, и спектр M-сигнала и спектр S-сигнала кодируются эффективно.

Кроме того, если имеются большие элементы на определенной частоте, и фаза L-сигнала и фаза R-сигнала не являются приблизительно противоположными, то один из спектра M-сигнала и спектра S-сигнала с большой вероятностью должен иметь большие элементы. Здесь, спектр M-сигнала и спектр S-сигнала элементов с одной частотой интегрируются рядом в интегрированный спектр, и интегрированный спектр разделяется на множество полос частот и кодируется в модуле 356 кодирования спектра, так что выполняется поиск и кодирование только одного из спектра M-сигнала и спектра S-сигнала частоты со значимыми элементами. Посредством этого можно не допускать кодирования двух импульсов элемента с одной частотой и реализовывать эффективное кодирование.

Фиг.16 является блок-схемой, показывающей основные компоненты в модуле 306 стереофонического декодирования. Модуль 306 стереофонического декодирования содержит модуль 331a демультиплексирования, модуль 332a LPC-деквантования, модуль 333a декодирования спектра, IMDCT-модуль 334a и синтезирующий фильтр 335a, которые выполняют операции, идентичные операциям модуля 331 демультиплексирования, модуля 332 LPC-деквантования, модуля 333 декодирования спектра, IMDCT-модуля 334 и синтезирующего фильтра 335 из модуля 303 монофонического декодирования, показанного на фиг.11. Дополнительно, модуль 306 стереофонического декодирования содержит модуль 361 разложения, IMDCT-модуль 362 и синтезирующий фильтр 363. Кроме того, на фиг.16 выходной сигнал синтезирующего фильтра 335a является стереофоническим декодированным M-сигналом, а выходной сигнал синтезирующего фильтра 363 является стереофоническим декодированным S-сигналом.

Модуль 361 разложения раскладывает декодированный спектр, принимаемый в качестве ввода из модуля 333a декодирования спектра, в декодированный спектр M-сигнала и декодированный спектр S-сигнала посредством противоположной обработки относительно обработки в модуле 353 интегрирования на фиг.13. Дополнительно, модуль 361 разложения выводит декодированный спектр M-сигнала в IMDCT-модуль 334a и выводит декодированный спектр S-сигнала в IMDCT-модуль 362.

IMDCT-модуль 362 преобразует декодированный спектр S-сигнала, принимаемый в качестве ввода из модуля 361 разложения, противоположным способом относительно MDCT-модуля 352, показанного на фиг.13, и выводит S-сигнал временных рядов, обнаруживаемый посредством преобразования, в синтезирующий фильтр 363.

Синтезирующий фильтр 363 предоставляет стереофонический декодированный S-сигнал посредством применения синтезирующего фильтра к S-сигналу временных рядов, принимаемому в качестве ввода из IMDCT-модуля 362, при использовании LPC-параметров, принимаемых в качестве ввода из модуля 332a LPC-деквантования.

Далее поясняется конфигурация и операции устройства декодирования стереофонических сигналов, поддерживающего устройство 100 кодирования стереофонических сигналов, показанное на чертеже 1.

Фиг.17 является блок-схемой, показывающей основные компоненты устройства 200 декодирования стереофонических сигналов, поддерживающего устройство 100 кодирования стереофонических сигналов.

На фиг.17 устройство 200 декодирования стереофонических сигналов содержит модуль 201 демультиплексирования, модуль 202 задания режима, модуль 203 декодирования базового слоя, модуль 204 декодирования первого улучшающего слоя, модуль 205 декодирования второго улучшающего слоя, модуль 206 декодирования третьего улучшающего слоя и модуль 207 вычисления суммы и разности.

Модуль 201 демультиплексирования демультиплексирует потоки битов, принимаемые в качестве ввода из устройства 100 кодирования стереофонических сигналов, в информацию режима, кодированную информацию базового слоя, кодированную информацию первого улучшающего слоя, кодированную информацию второго улучшающего слоя и кодированную информацию третьего улучшающего слоя, и выводит их в модуль 202 задания режима, модуль 203 декодирования базового слоя, модуль 204 декодирования первого улучшающего слоя, модуль 205 декодирования второго улучшающего слоя и модуль 206 декодирования третьего улучшающего слоя, соответственно.

Модуль 202 задания режима выводит информацию режима для задания режимов декодирования в модуле 203 декодирования базового слоя, модуле 204 декодирования первого улучшающего слоя, модуле 205 декодирования второго улучшающего слоя и модуле 206 декодирования третьего улучшающего слоя, принимаемую в качестве ввода из модуля 201 демультиплексирования, в эти модули декодирования.

Режим декодирования в каждом модуле декодирования упоминается как режим монофонического декодирования для декодирования только информации M-сигнала или режим стереофонического декодирования для декодирования как информации M-сигнала, так и информации S-сигнала. Здесь, информация M-сигнала типично соответствует самому M-сигналу или искажению при кодировании, связанному с M-сигналом, в каждом слое. Кроме того, информация S-сигнала типично соответствует самому S-сигналу или искажению при кодировании, связанному с S-сигналом в каждом слое.

Далее, режим декодирования в каждом слое показан с помощью каждого из битов информации режима. Таким образом, в битах значение "0" представляет режим монофонического декодирования, а значение "1" представляет режим стереофонического декодирования. Более конкретно, например, каждый из четырех битов информации режима используется для того, чтобы последовательно представлять режимы декодирования в модуле 203 декодирования базового слоя, модуле 204 декодирования первого улучшающего слоя, модуле 205 декодирования второго улучшающего слоя и модуле 206 декодирования третьего улучшающего слоя. Например, информация четырехбитового режима "0000" означает, что монофоническое декодирование выполняется во всех слоях. Кроме того, например, информация режима "0011" означает, что модуль 203 декодирования базового слоя и модуль 204 декодирования первого улучшающего слоя выполняют монофоническое декодирование, а модуль 205 декодирования второго улучшающего слоя и модуль 206 декодирования третьего улучшающего слоя выполняют стереофоническое декодирование. Таким образом, с помощью информации четырехбитового режима можно представлять шестнадцать типов режимов декодирования в четырех модулях декодирования.

В настоящем варианте осуществления информация режима, выводимая из модуля 202 задания режима, принимается в каждом модуле декодирования как идентичная входная информация четырехбитового режима. Дополнительно, каждый модуль декодирования проверяет только один бит из этих четырех входных битов, требуемых для того, чтобы задавать режим декодирования, и задает режим декодирования. Таким образом, во входной информации четырехбитового режима модуль 203 декодирования базового слоя проверяет первый бит, модуль 204 декодирования первого улучшающего слоя проверяет второй бит, модуль 205 декодирования второго улучшающего слоя проверяет третий бит, а модуль 206 декодирования третьего улучшающего слоя проверяет четвертый бит.

Тем не менее, вместо ввода идентичной информации четырехбитового режима в каждом модуле декодирования, модуль 202 задания режима может заранее сортировать один бит, требуемый для того, чтобы задавать режим декодирования в каждом модуле декодирования и выводить один бит в каждый модуль декодирования. Таким образом, в четырех битах информации режима модуль 202 задания режима может вводить только первый бит в модуле 203 декодирования базового слоя, только второй бит в модуле 204 декодирования первого улучшающего слоя, только третий бит в модуле 205 декодирования второго улучшающего слоя и только четвертый бит в модуле 206 декодирования третьего улучшающего слоя.

Кроме того, в любом из вышеописанных случаев информация режима, принимаемая в качестве ввода из модуля 201 демультиплексирования в модуль 202 задания режима, упоминается как информация четырехбитового режима.

В модуле 203 декодирования базового слоя режим монофонического декодирования или режим стереофонического декодирования задается на основе информации режима, принимаемой в качестве ввода из модуля 202 задания режима. Более конкретно, после задания режима монофонического декодирования модуль 203 декодирования базового слоя декодирует монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию базового слоя, и выводит результирующий декодированный M-сигнал базового слоя в модуль 204 декодирования первого улучшающего слоя. В этом случае информация S-сигнала не декодируется, и, следовательно, нулевой сигнал, видимо, выводится в модуль 204 декодирования первого улучшающего слоя как декодированный S-сигнал базового слоя.

Напротив, после задания режима стереофонического декодирования модуль 203 декодирования базового слоя декодирует стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию базового слоя, и выводит результирующий декодированный M-сигнал базового слоя и декодированный S-сигнал базового слоя в модуль 204 декодирования первого улучшающего слоя. Здесь, модуль 203 декодирования базового слоя полностью сбрасывает M-сигнал и S-сигнал (т.е. задает значения 0 для этих сигналов) перед декодированием. Кроме того, модуль 203 декодирования базового слоя подробнее поясняется ниже.

В модуле 204 декодирования первого улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 202 задания режима. Более конкретно, после задания режима монофонического декодирования модуль 204 декодирования первого улучшающего слоя декодирует монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию первого улучшающего слоя, и обнаруживает искажение при кодировании базового слоя M-сигнала. Модуль 204 декодирования первого улучшающего слоя суммирует искажение при кодировании базового слоя M-сигнала и декодированный M-сигнал базового слоя, принимаемые в качестве ввода из модуля 203 декодирования базового слоя, и выводит результат суммирования в модуль 205 декодирования второго улучшающего слоя как декодированный M-сигнал первого улучшающего слоя. Декодированный S-сигнал базового слоя, принимаемый в качестве ввода из модуля 203 декодирования базового слоя, выводится как есть в модуль 205 декодирования второго улучшающего слоя как декодированный S-сигнал первого улучшающего слоя.

Напротив, после задания режима стереофонического декодирования модуль 204 декодирования первого улучшающего слоя декодирует стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию первого улучшающего слоя, и обнаруживает искажения при кодировании базового слоя M- и S-сигналов. Модуль 204 декодирования первого улучшающего слоя суммирует искажение при кодировании базового слоя M-сигнала и декодированный M-сигнал базового слоя, принимаемые в качестве ввода из модуля 203 декодирования базового слоя, и выводит результат суммирования в модуль 205 декодирования второго улучшающего слоя как декодированный M-сигнал первого улучшающего слоя. Кроме того, модуль 204 декодирования первого улучшающего слоя суммирует искажение при кодировании базового слоя S-сигнала и декодированный S-сигнал базового слоя, принимаемые в качестве ввода из модуля 203 декодирования базового слоя, и выводит результат суммирования в модуль 205 декодирования второго улучшающего слоя как декодированный S-сигнал первого улучшающего слоя. Кроме того, модуль 204 декодирования первого улучшающего слоя подробнее поясняется ниже.

В модуле 205 декодирования второго улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 202 задания режима. Более конкретно, после задания режима монофонического декодирования модуль 205 декодирования второго улучшающего слоя декодирует монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию второго улучшающего слоя, и обнаруживает искажение при кодировании первого улучшающего слоя, связанное с M-сигналом. Модуль 205 декодирования второго улучшающего слоя суммирует искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, и декодированный M-сигнал первого улучшающего слоя, принимаемые в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат суммирования в модуль 206 декодирования третьего улучшающего слоя как декодированный M-сигнал второго улучшающего слоя. Декодированный S-сигнал первого улучшающего слоя, принимаемый в качестве ввода из модуля 204 декодирования первого улучшающего слоя, выводится как есть в модуль 206 декодирования третьего улучшающего слоя как декодированный S-сигнал второго улучшающего слоя.

Напротив, после задания режима стереофонического декодирования модуль 205 декодирования второго улучшающего слоя декодирует стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию второго улучшающего слоя, и обнаруживает искажения при кодировании первого улучшающего слоя, связанные с M- и S-сигналами. Модуль 205 декодирования второго улучшающего слоя суммирует искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, и декодированный M-сигнал первого улучшающего слоя, принимаемые в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат суммирования в модуль 206 декодирования третьего улучшающего слоя как декодированный M-сигнал второго улучшающего слоя. Кроме того, модуль 205 декодирования второго улучшающего слоя суммирует искажение при кодировании первого улучшающего слоя, связанное с S-сигналом, и декодированный S-сигнал первого улучшающего слоя, принимаемые в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат суммирования в модуль 206 декодирования третьего улучшающего слоя как декодированный S-сигнал второго улучшающего слоя. Кроме того, модуль 205 декодирования второго улучшающего слоя подробнее поясняется ниже.

В модуле 206 декодирования третьего улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 202 задания режима. Более конкретно, после задания режима монофонического декодирования модуль 206 декодирования третьего улучшающего слоя декодирует монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию третьего улучшающего слоя, и обнаруживает искажение при кодировании второго улучшающего слоя, связанное с M-сигналом. Модуль 206 декодирования третьего улучшающего слоя суммирует искажение при кодировании второго улучшающего слоя, связанное с M-сигналом, и декодированный M-сигнал второго улучшающего слоя, принимаемые в качестве ввода из модуля 205 декодирования второго улучшающего слоя, и выводит результат суммирования в модуль 207 вычисления суммы и разности как декодированный M-сигнал третьего улучшающего слоя. Декодированный S-сигнал второго улучшающего слоя, принимаемый в качестве ввода из модуля 205 декодирования второго улучшающего слоя, выводится как есть в модуль 207 вычисления суммы и разности как декодированный S-сигнал третьего улучшающего слоя.

Напротив, после задания режима стереофонического декодирования модуль 206 декодирования третьего улучшающего слоя декодирует стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию третьего улучшающего слоя, и обнаруживает искажения при кодировании второго улучшающего слоя, связанные с M- и S-сигналами. Модуль 206 декодирования третьего улучшающего слоя суммирует искажение при кодировании второго улучшающего слоя, связанное с M-сигналом, и декодированный M-сигнал второго улучшающего слоя, принимаемые в качестве ввода из модуля 205 декодирования второго улучшающего слоя, и выводит результат суммирования в модуль 207 вычисления суммы и разности как декодированный M-сигнал третьего улучшающего слоя. Кроме того, модуль 206 декодирования третьего улучшающего слоя суммирует искажение при кодировании второго улучшающего слоя, связанное с S-сигналом, и декодированный S-сигнал второго улучшающего слоя, принимаемые в качестве ввода из модуля 205 декодирования второго улучшающего слоя, и выводит результат суммирования в модуль 207 вычисления суммы и разности как декодированный S-сигнал третьего улучшающего слоя. Кроме того, модуль 206 декодирования третьего улучшающего слоя подробнее поясняется ниже.

Модуль 207 вычисления суммы и разности вычисляет декодированный L-сигнал и декодированный R-сигнал согласно следующим уравнениям 9 и 10 с помощью декодированного M-сигнала третьего улучшающего слоя и декодированного S-сигнала третьего улучшающего слоя, принимаемых в качестве ввода из модуля 206 декодирования третьего улучшающего слоя.

Li'=(Mi'+Si')/2 … (уравнение 9)

Ri'=(Mi'-Si')/2 … (уравнение 10)

В уравнениях 9 и 10 Mi' представляет декодированный M-сигнал третьего улучшающего слоя, si' представляет декодированный S-сигнал третьего улучшающего слоя, Li' представляет декодированный L-сигнал, а Ri' представляет декодированный R-сигнал.

Фиг.18 является блок-схемой, показывающей основные компоненты в модуле 203 декодирования базового слоя.

Модуль 203 декодирования базового слоя, показанный на фиг.18, содержит переключатель 231, модуль 232 монофонического декодирования, модуль 233 стереофонического декодирования, переключатель 234 и переключатель 235.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 231 выводит монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию базового слоя, в модуль 232 монофонического декодирования, а если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", выводит стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию базового слоя, в модуль 233 стереофонического декодирования.

Модуль 232 монофонического декодирования выполняет монофоническое декодирование с помощью монофонической кодированной информации, принимаемой в качестве ввода из переключателя 231, и выводит результирующий декодированный M-сигнал базового слоя в переключатель 234. Кроме того, конфигурация и операции в модуле 232 монофонического декодирования являются идентичными конфигурации и операциям в модуле 303 монофонического декодирования, показанном на фиг.11, и, следовательно, их конкретное пояснение опускается.

Модуль 233 стереофонического декодирования выполняет стереофоническое декодирование с помощью стереофонической кодированной информации, принимаемой в качестве ввода из переключателя 231, выводит результирующий декодированный M-сигнал базового слоя и декодированный S-сигнал базового слоя в переключатель 234 и переключатель 235, соответственно. Кроме того, конфигурация и операции в модуле 233 стереофонического декодирования являются идентичными конфигурации и операциям в модуле 306 стереофонического декодирования, показанном на фиг.16, и, следовательно, их конкретное пояснение опускается.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 234 выводит декодированный M-сигнал базового слоя, принимаемый в качестве ввода из модуля 232 монофонического декодирования, в модуль 204 декодирования первого улучшающего слоя. Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", переключатель 234 выводит декодированный M-сигнал базового слоя, принимаемый в качестве ввода из модуля 233 стереофонического декодирования, в модуль 204 декодирования первого улучшающего слоя.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 235 отключается и не выводит сигнал. Здесь, в качестве эквивалентной обработки, фактически сигнал из всех нулевых значений (т.е. нулевой сигнал) выводится в модуль 204 декодирования первого улучшающего слоя как декодированный S-сигнал базового слоя. Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", принимаемый декодированный S-сигнал базового слоя в качестве ввода из модуля 233 стереофонического декодирования выводится в модуль 204 декодирования первого улучшающего слоя.

Фиг.19 является блок-схемой, показывающей основные компоненты в модуле 205 декодирования второго улучшающего слоя. Здесь, модуль 204 декодирования первого улучшающего слоя, модуль 205 декодирования второго улучшающего слоя и модуль 206 декодирования третьего улучшающего слоя, показанные на фиг.17, имеют идентичную внутреннюю конфигурацию и операции, но различаются по входным сигналам и выходным сигналам. Следовательно, примерный случай поясняется с помощью только модуля 205 декодирования второго улучшающего слоя.

На фиг.19 модуль 205 декодирования второго улучшающего слоя содержит переключатель 251, модуль 252 монофонического декодирования, модуль 253 стереофонического декодирования, переключатель 254, сумматор 255, переключатель 256 и сумматор 257.

Если значение третьего бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 251 выводит монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию второго улучшающего слоя, в модуль 252 монофонического декодирования. Кроме того, если значение третьего бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", переключатель 251 выводит стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию второго улучшающего слоя, в модуль 253 стереофонического декодирования.

Модуль 252 монофонического декодирования выполняет монофоническое декодирование с помощью монофонической кодированной информации, принимаемой в качестве ввода из переключателя 251, и выводит результирующее искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, в переключатель 254. Кроме того, конфигурация и операции в модуле 252 монофонического декодирования, показанном на фиг.11, являются идентичными конфигурации и операциям в модуле 303 монофонического декодирования, и, следовательно, их конкретное пояснение опускается.

Модуль 253 стереофонического декодирования выполняет стереофоническое декодирование с помощью стереофонической кодированной информации, принимаемой в качестве ввода из переключателя 251, и выводит результирующее искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, и искажение при кодировании первого улучшающего слоя, связанное с S-сигналом, в переключатель 254 и переключатель 257, соответственно. Кроме того, конфигурация и операции в модуле 253 стереофонического декодирования являются идентичными конфигурации и операциям в модуле 306 стереофонического декодирования, показанном на фиг.16, и, следовательно, их конкретное пояснение опускается.

Если значение третьего бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 254 выводит искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, принимаемым в качестве ввода из модуля 252 монофонического декодирования, в сумматор 255. Кроме того, если значение третьего бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", переключатель 254 выводит искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, принимаемым в качестве ввода из модуля 253 стереофонического декодирования, в сумматор 255.

Сумматор 255 суммирует искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, принимаемым в качестве ввода из переключателя 254, и декодированный M-сигнал первого улучшающего слоя, принимаемый в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат суммирования в модуль 206 декодирования третьего улучшающего слоя как декодированный M-сигнал второго улучшающего слоя.

Сумматор 257 суммирует искажение при кодировании первого улучшающего слоя, связанное с S-сигналом, принимаемым в качестве ввода из модуля 253 стереофонического декодирования, и декодированный S-сигнал первого улучшающего слоя, принимаемый в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат в переключатель 256.

Если значение второго бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 256 выводит декодированный S-сигнал первого улучшающего слоя, принимаемый в качестве ввода из модуля 204 декодирования первого улучшающего слоя, как есть в модуль 206 декодирования третьего улучшающего слоя. Кроме того, если значение второго бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", переключатель 256 выводит результат суммирования, принимаемый в качестве ввода из сумматора 257, в модуль 206 декодирования третьего улучшающего слоя как декодированный S-сигнал второго улучшающего слоя.

Таким образом, согласно настоящему варианту осуществления, масштабируемое кодирование выполняется для монофонического сигнала (т.е. M-сигнала) и бокового сигнала (т.е. S-сигнала), вычисляемых из L-сигнала и R-сигнала стереофонического сигнала, так что можно выполнять масштабируемое кодирование с использованием корреляции между L-сигналом и R-сигналом. Дополнительно, согласно настоящему варианту осуществления, режим кодирования в каждом слое в масштабируемом кодировании задается на основе информации режима, так что можно задавать слой для выполнения монофонического кодирования и слой для выполнения стереофонического кодирования и повышать степень свободы в управлении точностью кодирования.

Кроме того, согласно настоящему варианту осуществления, спектр M-сигнала и спектр S-сигнала интегрируются и кодируются таким образом, что спектры одной частоты являются смежными друг с другом, так что можно выполнять автоматическое выделение битов без специальной классификации на основе решений или случаев при стереофоническом кодировании и выполнять эффективное кодирование согласно значимости информации L-сигнала и R-сигнала.

Второй вариант осуществления

Фиг.20 является блок-схемой, показывающей основные компоненты устройства 110 кодирования стереофонических сигналов согласно варианту осуществления 2 настоящего изобретения. Устройство 110 кодирования стереофонических сигналов, показанное на фиг.20, имеет в основном идентичную конфигурацию и выполняет в основном идентичные операции устройству 100 кодирования стереофонических сигналов, показанному на фиг.1. Следовательно, что касается модулей, которые выполняют идентичные операции для фиг.1 и фиг.20, "a" назначается ссылкам с номерами модулей на фиг.20. Например, модуль на фиг.20, соответствующий модулю 101 вычисления суммы и разности на фиг.1, выражается как модуль 101a вычисления суммы и разности. Кроме того, устройство 110 кодирования стереофонических сигналов на фиг.20 отличается от устройства 100 кодирования стереофонических сигналов на фиг.1 включением дополнительных модулей 112-114 задания режима. Кроме того, модуль 111 задания режима устройства 110 кодирования стереофонических сигналов на фиг.20 отличается от модуля 102 задания режима устройства 100 кодирования стереофонических сигналов на фиг.1 входными сигналами, и, следовательно, ему назначается другая ссылка с номером. Здесь, модули 111-114 задания режима, показанные на фиг.20, имеют идентичную внутреннюю конфигурацию и операции, но различаются по входным сигналам и выходным сигналам. Следовательно, примерный случай поясняется с помощью только модуля 111 задания режима.

Модуль 111 задания режима вычисляет мощность M-сигнала и S-сигнала, принимаемых в качестве ввода из модуля 101a вычисления суммы и разности, и на основе вычисленной мощности и заранее определенных условных уравнений задает режим монофонического кодирования для кодирования только информации M-сигнала или режим стереофонического кодирования для кодирования как информации M-сигнала, так и информации S-сигнала. Например, режим стереофонического кодирования задается, если мощность S-сигнала превышает мощность M-сигнала, или режим монофонического кодирования задается, если мощность S-сигнала ниже мощности M-сигнала. Кроме того, если мощность M-сигнала и мощность S-сигнала является низкой, режим монофонического кодирования задается. Это учитывает то, что когда кодеры разрабатываются, кодер стереофонических сигналов, который обрабатывает два типа сигналов, предоставляет более высокий битрейт, чем кодер монофонических сигналов, который обрабатывает один тип сигнала. Кроме того, информация о заданном режиме выводится в модуль 103a кодирования базового слоя и модуль 107a мультиплексирования.

Вычисление мощности в модуле 111 задания режима выполняется согласно следующим уравнениям 11 и 12.

[7]

… (уравнение 11)

… (уравнение 12)

В уравнениях 11 и 12 i представляет номер выборки, PowM представляет мощность M-сигнала, а M_i представляет M-сигнал. Кроме того, PowS представляет мощность S-сигнала, а s_i представляет S-сигнал.

Заранее определенное условное уравнение в модуле 111 задания режима показано в следующем уравнении 13.

[8]

В уравнении 13 α представляет константу для оценки полной мощности и может приспосабливать верхнее предельное значение мощности сигнала, который не воспринимается. Кроме того, β представляет константу для оценки мощности S-сигнала. Способ вычисления константы β для оценки мощности S-сигнала описывается ниже. Кроме того, m представляет режим. Здесь, например, константа α для оценки полной мощности и константа β для оценки мощности S-сигнала сохраняются в ROM.

Что касается константы β для оценки мощности S-сигнала, если сигнал меньшего искажения при кодировании выбирается из L-сигнала и R-сигнала, способ статистического вычисления и сохранения соответствующих β в модулях 111-114 задания режима является возможным. Конкретный способ вычисления константы для оценки мощности S-сигнала β поясняется ниже.

Здесь поясняется способ вычисления константы β для оценки мощности S-сигнала в модуле 111 задания режима. Во-первых, большой объем стереофонических речевых данных принимается в качестве ввода в модуле 111 задания режима для обучения, и отношение между мощностью M-сигнала и мощностью S-сигнала вычисляется согласно следующему уравнению 14.

[9]

… (уравнение 14)

В уравнении 14 i представляет номер выборки каждого сигнала, а j представляет номер обучающих стереофонических речевых данных. Кроме того, M_i представляет M-сигнал, а s_i представляет S-сигнал. Кроме того, PowM_j представляет мощность M-сигнала J-х обучающих стереофонических речевых данных, а PowS_j представляет мощность S-сигнала J-х обучающих стереофонических речевых данных.

Затем, противоположная обработка относительно понижающего микширования выполняется для декодированного M-сигнала и декодированного S-сигнала, обнаруживаемых посредством кодирования и декодирования в двух режимах в модуле 103a кодирования базового слоя, чтобы находить декодированный L-сигнал и декодированный R-сигнал. Вычисляются суммы отношений "сигнал-шум" результирующего декодированного L-сигнала и декодированного R-сигнала (т.е. отношения "сигнал-шум" в случае, когда искажение при кодировании L-сигнала и R-сигнала, принимаемых в качестве ввода в устройстве 110 кодирования стереофонических сигналов, рассматривается как шум), т.е. E0j и E1j.

Затем, посредством постепенного изменения значения β между 0 и 1,0 полное отношение "сигнал-шум" E_β, показанное в следующем уравнении 15, вычисляется.

[10]

Значение β, чтобы максимизировать вышеприведенное E_β, вычисляется. Это значение сохраняется в модуле 111 задания режима и используется как константа для оценки мощности S-сигнала β. Аналогично модулю 111 задания режима, модули 112-114 задания режима вычисляют и сохраняют константу для оценки мощности S-сигнала β.

Кроме того, устройство декодирования стереофонических сигналов согласно варианту осуществления 2 настоящего изобретения имеет конфигурацию, идентичную конфигурации на фиг.17 варианта осуществления 1, и, следовательно, пояснение опускается.

Таким образом, согласно настоящему варианту осуществления, по мере того как проходит обработка кодирования в каждом слое, режим кодирования в каждом слое при масштабируемом кодировании задается на основе локальных признаков речи, так что можно автоматически задавать слой для выполнения монофонического кодирования и слой для выполнения стереофонического кодирования и предоставлять декодированные сигналы высокого качества. Кроме того, если битрейт варьируется между режимами, управление скоростью передачи осуществляется автоматически, так что можно экономить число информационных битов.

Выше описаны варианты осуществления настоящего изобретения.

Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых стереофонические сигналы главным образом используются как речевые сигналы, разумеется, что стереофонические сигналы могут использоваться как аудиосигналы.

Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых модуль 353 интегрирования интегрирует спектр M-сигнала и спектр S-сигнала так, что спектры одной частоты являются смежными друг с другом, настоящее изобретение не ограничено этим, и в равной степени можно интегрировать эти спектры в модуле 353 интегрирования так, что спектр S-сигнала простым способом размещается смежно до или после спектра M-сигнала.

Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых два типа стереофонических сигналов представляются с помощью названий "сигнал левого канала" и "сигнал правого канала", в равной степени можно использовать более общие названия, к примеру "сигнал первого канала" и "сигнал второго канала". Кроме того, ассоциирование между битовыми значениями "0" и "1" и режимами кодирования "режим монофонического кодирования" и "режим стереофонического кодирования" не ограничено.

Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых настоящее изобретение применяется к техническим требованиям, в которых частота дискретизации составляет 16 кГц, а длина кадра составляет 20 мс, настоящее изобретение не ограничено этим, и в равной степени можно применять настоящее изобретение к другим техническим требованиям, в которых частота дискретизации составляет 8 кГц, 24 кГц, 32 кГц, 44,1 кГц, 48 кГц и т.д., а длина кадра составляет 10 мс, 30 мс, 40 мс и т.д. Настоящее изобретение не зависит от частоты дискретизации или длины кадра.

Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых конфигурация с четырьмя слоями используется в масштабируемом кодировании, настоящее изобретение не ограничено этим, и в равной степени можно использовать другие числа слоев, отличные от четырех. Настоящее изобретение не зависит от числа слоев.

Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых импульсное кодирование используется для того, чтобы кодировать спектр сигнала возбуждения, настоящее изобретение не ограничено этим, и для того, чтобы кодировать спектр сигнала возбуждения, в равной степени можно использовать VQ, прогнозирующее VQ, раздельное VQ, многостадийное VQ, технологии расширения полосы частот, межканальное прогнозирующее декодирование и т.д. Настоящее изобретение не зависит от схем кодирования спектра.

Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых стереофонические сигналы кодируются, чтобы передавать кодированную информацию, настоящее изобретение не ограничено этим, и в равной степени можно сохранять кодированную информацию на носителе хранения данных. Например, хотя кодированная информация аудиосигналов зачастую сохраняется в запоминающем устройстве или на диске и используется, настоящее изобретение одинаково эффективно в этом случае. Настоящее изобретение не зависит от того, передается кодированная информация или хранится.

Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых стереофонический сигнал формируется с помощью двух каналов, настоящее изобретение не ограничено этим, и в равной степени можно формировать стереофонический сигнал с помощью множества каналов, к примеру, каналов 5.1.

Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых кодирование выполняется с использованием только размера спектров M-сигнала и S-сигнала в качестве меры расстояния, настоящее изобретение не ограничено этим, и в равной степени можно выполнять кодирование с использованием разности фаз или энергетического отношения между M-сигналом и S-сигналом в качестве меры расстояния. Настоящее изобретение не зависит от меры расстояния, которую следует использовать при кодировании спектра.

Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых устройство декодирования стереофонических сигналов принимает и обрабатывает потоки битов, передаваемые от устройства кодирования стереофонических сигналов, настоящее изобретение не ограничено этим, и устройство декодирования стереофонических сигналов может принимать и обрабатывать потоки битов до тех пор, пока эти потоки битов передаются из устройства кодирования, которое может формировать потоки битов, которые могут обрабатываться в этом устройстве декодирования.

Кроме того, устройство кодирования стереофонических сигналов и устройство декодирования стереофонических сигналов согласно настоящему изобретению могут быть установлены на устройстве терминала связи и устройстве базовой станции в системе мобильной связи, так что можно предоставлять устройство терминала связи, устройство базовой станции и систему мобильной связи, имеющую функциональные эффекты, идентичные указанным выше.

Хотя в вышеприведенных вариантах осуществления описаны примерные случаи, в которых настоящее изобретение реализуется с помощью аппаратных средств, настоящее изобретение может быть реализовано с помощью программного обеспечения. Например, посредством описания алгоритма, согласно настоящему изобретению на языке программирования - сохранения этой программы в запоминающем устройстве и предписания модулю обработки информации выполнять эту программу можно реализовывать функцию, идентичную функции в устройстве кодирования стереофонических сигналов согласно настоящему изобретению.

Более того, каждый функциональный блок, используемый в пояснении каждого из вышеприведенных вариантов осуществления, типично может быть реализован как LSI, состоящая из интегральной схемы. Это могут быть отдельные микросхемы, либо они могут частично или полностью содержаться на одной микросхеме.

В данном документе употребляется термин LSI, но она также может упоминаться как IC, "системная LSI", "супер-LSI" или "ультра-LSI", в зависимости от отличающейся степени интеграции.

Более того, способ интеграции микросхем не ограничен LSI, и реализация с помощью специализированных схем или процессора общего назначения также возможна. После изготовления LSI использование FPGA (программируемой пользователем вентильной матрицы) или реконфигурируемого процессора, где соединения или разъемы ячеек схемы в LSI могут быть переконфигурированы, также возможно.

Кроме того, если появится технология интегральных микросхем, чтобы заменять LSI, в результате усовершенствования полупроводниковой технологии или другой производной технологии, разумеется, также можно выполнять интеграцию функциональных блоков с помощью этой технологии. Применение биотехнологии также допускается.

Раскрытия сущности заявки на патент (Япония) №2008-72497, поданной 19 марта 2008 года, и заявки на патент (Япония) №2008-274536, поданной 24 октября 2008 года, в том числе подробное описание, чертежи и реферат, полностью содержатся в данном документе по ссылке.

Промышленная применимость

Настоящее изобретение является подходящим для использования, например, в устройстве кодирования, которое кодирует речевые сигналы и аудиосигналы, и в устройстве декодирования, которое декодирует кодированные сигналы.

1. Устройство кодирования стереофонических сигналов, содержащее:
- модуль вычисления суммы и разности, который формирует монофонический сигнал, связанный с суммой сигнала первого канала и сигнала второго канала, образующих стереофонический сигнал, и формирует боковой сигнал, связанный с разностью между сигналом первого канала и сигналом второго канала;
модуль формирования информации режима, который формирует информацию режима в расчете на слой, указывающую режим кодирования одного из монофонического кодирования и стереофонического кодирования; и
модули кодирования слоев с первого по N-й, которые выполняют монофоническое кодирование в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) с помощью информации, связанной с монофоническим сигналом, или выполняют стереофоническое кодирование в i-м слое с помощью как информации, связанной с монофоническим сигналом, так и информации, связанной с боковым сигналом, на основе информации режима и предоставляют кодированную информацию i-го слоя.

2. Устройство кодирования стереофонических сигналов по п.1, в котором:
модуль формирования информации режима формирует информацию режима из N битов, указывающую режим кодирования, с помощью каждого из битов; и
модуль кодирования i-го слоя выполняет монофоническое кодирование в i-м слое или выполняет стереофоническое кодирование в i-м слое на основе значения i-го бита информации режима.

3. Устройство кодирования стереофонических сигналов по п.2, в котором модуль кодирования первого слоя содержит:
модуль монофонического кодирования первого слоя, который, когда значение первого бита информации режима указывает монофоническое кодирование, выполняет монофоническое кодирование в первом слое с использованием монофонического сигнала и выводит искажение при кодировании, связанное с монофоническим сигналом в первом слое, и боковой сигнал в модуль кодирования второго слоя; и
модуль стереофонического кодирования первого слоя, который, когда значение первого бита информации режима указывает стереофоническое кодирование, выполняет стереофоническое кодирование в первом слое с использованием как монофонического сигнала, так и бокового сигнала и выводит искажение при кодировании, связанное с монофоническим сигналом в первом слое, и искажение при кодировании, связанное с боковым сигналом в первом слое, в модуль кодирования второго слоя.

4. Устройство кодирования стереофонических сигналов по п.3, в котором модуль кодирования n-го (n=2, 3, …, N-1) слоя содержит:
модуль монофонического кодирования n-го слоя, который, когда значение n-го бита информации режима указывает монофоническое кодирование, выполняет монофоническое кодирование в n-м слое с использованием информации, связанной с монофоническим сигналом, и выводит искажение при кодировании, связанное с монофоническим сигналом в n-м слое, и информацию, связанную с боковым сигналом, принимаемую в качестве ввода из (n-1)-го слоя, в модуль кодирования (n+1)-го слоя; и
модуль стереофонического кодирования n-го слоя, который, когда значение n-го бита информации режима указывает стереофоническое кодирование, выполняет стереофоническое кодирование в n-м слое с помощью как информации, связанной с монофоническим сигналом, так и информации, связанной с боковым сигналом, и выводит искажение при кодировании, связанное с монофоническим сигналом в n-м слое, и искажение при кодировании, связанное с боковым сигналом в n-м слое, в модуль кодирования (n+1)-го слоя.

5. Устройство кодирования стереофонических сигналов по п.4, в котором модуль кодирования N-го слоя содержит:
модуль монофонического кодирования N-го слоя, который, когда значение N-го бита информации режима указывает монофоническое кодирование, выполняет монофоническое кодирование в N-м слое с использованием информации, связанной с монофоническим сигналом; и модуль стереофонического кодирования N-го слоя, который, когда значение N-го бита информации режима указывает стереофоническое кодирование, выполняет стереофоническое кодирование в N-м слое с помощью как информации, связанной с монофоническим сигналом, так и информации, связанной с боковым сигналом.

6. Устройство кодирования стереофонических сигналов по п.5, в котором модуль стереофонического кодирования i-го слоя содержит:
первый модуль преобразования, который преобразует информацию, связанную с монофоническим сигналом, в частотную область и предоставляет первый спектр;
второй модуль преобразования, который преобразует информацию, связанную с боковым сигналом, в частотную область и предоставляет второй спектр;
модуль интегрирования, который интегрирует первый спектр и второй спектр, чтобы предоставлять интегрированный спектр; и модуль кодирования спектра, который выполняет кодирование спектра в отношении интегрированного спектра.

7. Устройство кодирования стереофонических сигналов по п.6, в котором модуль интегрирования интегрирует первый спектр и второй спектр так, что спектры одной частоты являются смежными друг с другом.

8. Устройство кодирования стереофонических сигналов по п.6, в котором модуль интегрирования интегрирует первый спектр и второй спектр так, что первый спектр является смежным до или после второго спектра.

9. Устройство кодирования стереофонических сигналов по п.1, в котором модуль формирования информации режима формирует информацию режима, который должен применяться к (i+1)-му слою, с использованием монофонического сигнала и бокового сигнала, принимаемых в качестве ввода в модуле кодирования i-го слоя.

10. Устройство кодирования стереофонических сигналов по п.9, в котором модуль формирования информации режима вычисляет мощности монофонического сигнала и бокового сигнала, принимаемых в качестве ввода в модуле кодирования i-го слоя, и формирует информацию режима на основе относительной взаимосвязи между вычисленными мощностями.

11. Устройство декодирования стереофонических сигналов, содержащее:
приемный модуль, который принимает информацию режима и кодированную информацию слоев с первого по N-й, обнаруживаемую посредством обработки кодирования в слоях с первого по N-й, причем информация режима указывает, какое из монофонического кодирования и стереофонического кодирования выполняется при обработке кодирования в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) устройства кодирования стереофонических сигналов, которое выполняет кодирование с использованием сигнала первого канала и сигнала второго канала, образующих стереофонический сигнал;
модули декодирования слоев с первого по N-й, которые выполняют монофоническое декодирование или стереофоническое декодирование с использованием кодированной информации i-го слоя на основе информации режима и предоставляют результат декодирования монофонического сигнала в i-м слое и результат декодирования бокового сигнала в i-м слое, причем монофонический сигнал связан с суммой сигнала первого канала и сигнала второго канала, а боковой сигнал связан с разностью между сигналом первого канала и сигналом второго канала; и
модуль вычисления суммы и разности, который вычисляет декодированный сигнал первого канала и декодированный сигнал второго канала с использованием результата декодирования монофонического сигнала в N-м слое и результата декодирования бокового сигнала в N-м слое.

12. Способ кодирования стереофонических сигналов, содержащий этапы, на которых:
формируют монофонический сигнал, связанный с суммой сигнала первого канала и сигнала второго канала, образующих стереофонический сигнал, и формируют боковой сигнал, связанный с разностью между сигналом первого канала и сигналом второго канала;
формируют информацию режима в расчете на слой, указывающую режим кодирования одного из монофонического кодирования и стереофонического кодирования; и
выполняют монофоническое кодирование в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) с помощью информации, связанной с монофоническим сигналом, или выполняют стереофоническое кодирование в i-м слое с помощью как информации, связанной с монофоническим сигналом, так и информации, связанной с боковым сигналом, на основе информации режима и предоставляют кодированную информацию i-го слоя.

13. Способ декодирования стереофонических сигналов, содержащий этапы, на которых:
принимают информацию режима и кодированную информацию слоев с первого по N-й, обнаруживаемую посредством обработки кодирования в слоях с первого по N-й, причем информация режима указывает, какое из монофонического кодирования и стереофонического кодирования выполняется при обработке кодирования в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) устройства кодирования стереофонических сигналов, которое выполняет кодирование с использованием сигнала первого канала и сигнала второго канала, образующих стереофонический сигнал;
выполняют монофоническое декодирование или стереофоническое декодирование с использованием кодированной информации i-го слоя на основе информации режима и предоставляют результат декодирования монофонического сигнала в i-м слое и результат декодирования бокового сигнала в i-м слое, причем монофонический сигнал связан с суммой сигнала первого канала и сигнала второго канала, а боковой сигнал связан с разностью между сигналом первого канала и сигналом второго канала; и
вычисляют декодированный сигнал первого канала и декодированный сигнал второго канала с использованием результата декодирования монофонического сигнала в N-м слое и результата декодирования бокового сигнала в N-м слое.

Способ оценки частоты одиночного гармонического колебания в ограниченном диапазоне // 2480847

Изобретение относится к радиотехнике, а именно к способам точной оценки частоты одиночного гармонического колебания в ограниченном диапазоне. .

Способ обнаружения границ слов и устройство для его осуществления // 1094049

Устройство для контроля уровня шума отдельного источника // 1048504

Способ измерения интенсивности звука локального источника на дискретной частоте // 987671

Способ определения границы свободного поля в заглушенных звукомерных камерах // 983747

Излучатель для корреляционных акустических измерений // 945889

Устройство для распознавания речи // 920823

Способ измерения диаграмм направленности акустических источников на дискретной частоте // 871188

Устройство для измерения шума // 838707

Способ и устройство для кодирования и декодирования, основывающегося на объектах аудиосигнала // 2484543

Кодирующее устройство, декодирующее устройство и способ // 2488897

Изобретение относится к вычислительной технике

Устройство и способ определения множества локальных частотных центров тяжести в спектре аудиосигнала // 2490729

Изобретение относится к области цифровой обработки звука

Способ и дискриминатор для классификации различных сегментов сигнала // 2507609

Способ и дискриминатор для классификации различных сегментов сигнала, предназначенный для того, чтобы классифицировать различные сегменты сигнала, включающий сегменты, по крайней мере, первого и второго типов, например музыкальные и речевые сегменты, сигнал краткосрочной классификации (150) на основе, по крайней мере, одной краткосрочной особенности, извлеченной из сигнала, и краткосрочный результат классификации (152); сигнал долгосрочной классификации (154) на основе, по крайней мере, одной краткосрочной особенности и, по крайней мере, одной долгосрочной особенности, извлеченной из сигнала, и долгосрочный результат классификации (156). Краткосрочный результат классификации (152) и долгосрочный результат классификации (156) объединены (158), чтобы обеспечить выходной сигнал выбора (160), указывающий, имеет ли сегмент сигнала первый тип или второй тип. Технический результат - обеспечение улучшенного подхода для того, чтобы различить в сигнале сегменты различного типа, сохраняя низкой любую задержку, внесенную дискриминатором. 6 н. и 11 з.п. ф-лы, 7 ил., 2 табл.

Способ оценки качества аудиосигнала, устройство и считываемый компьютером записываемый носитель, записывающий программу // 2517393

Изобретение относится к средствам оценки качества аудиосигнала для мультимедийной телекоммуникационной службы. Технический результат заключается в повышении точности определения качества аудиосигнала. Вычисляют частоту потерь аудиопакетов, когда в однократно или постоянно генерируемых потерях IP пакетов существует по меньшей мере один аудиопакет, подлежащий оценке, при этом вычисление частоты потерь аудиопакетов основано на информации из принятых IP пакетов посредством подсчета потерь пакетов. Вычисляют среднее время воздействия/средней длительности аудиопакета на основе информации принятых IP пакетов, причем среднее время воздействия служит в качестве среднего времени, в течение которого на качество аудиосигнала оказывается влияние при частоте потерь аудиопакетов, содержащихся в единовременной потере аудиопакетов. Оценивают значения оценки субъективного качества на основе частоты потерь аудиопакетов и одного из среднего времени воздействия и средней длительности аудиопакет. Вычисляют скорость передачи аудиоданных для вычисления скорости передачи аудиоданных на основе информации из принятых IP пакетов. Значение оценки субъективного качества вычисляют на основе значения качества кодированного аудиосигнала, частоты потерь аудиопакетов и среднего времени воздействия. 4 н. и 4 з.п. ф-лы, 25 ил.

Способ выделения речевого сигнала в условиях наличия помех и устройство для его осуществления // 2536343

Изобретение относится к вычислительной технике. Технический результат заключается в повышении эффективности выделения речевого сигнала в условиях наличия помех. Способ выделения речевого сигнала в условиях наличия помех, в котором входную смесь акустического сигнала и помехи преобразуют в электрический сигнал, фильтруют полосовым фильтром, получив смесь речевого сигнала и помехи с заданной полосой частот, которую усиливают в усилителе низкой частоты (УНЧ), в аналогово-цифровом преобразователе (АЦП) формируют отсчеты смеси сигнала и помехи в цифровом виде и подают их в вычислительное устройство, где формируют пары сумм амплитуд отсчетов определенным образом и рассчитывают амплитуды сигнала для каждого момента времени с использованием полученных результатов суммирования путем решения соответствующих систем линейных уравнений. 2 ил., 1 табл.

Устройство, способ и машиночитаемый носитель для получения параметра, описывающего изменение характеристики сигнала // 2543308

Группа изобретений относится к средствам для анализа временных вариаций аудио сигналов. Технический результат заключается в создании средств, обладающих повышенной надежностью, для получения параметра, описывающего временные изменения сигнальной характеристики. Для этого предложено устройство для получения параметра, который описывает изменения сигнальной характеристики сигнала на основе фактических параметров области преобразования, описывающих аудиосигнал в области преобразования, которое включает определитель параметра. Определитель параметра предназначен для определения одного или нескольких модельных параметров модели изменения в области преобразования, описывающих эволюцию параметров области преобразования в зависимости от одного или нескольких модельных параметров, представляющих сигнальную характеристику, так, что модельная ошибка, представляющая собой отклонения между моделируемой временной эволюцией параметров в области преобразования и эволюцией фактических параметров области преобразования снижается ниже заданного порогового значения или сводится к минимуму. 13 н. и 14 з.п. ф-лы, 9 ил.

Способ выявления эмоционального состояния человека по голосу // 2553413

Изобретение относится к системам анализа речи и может быть использовано для определения эмоционального состояния человека по голосу, применительно к задачам криминалистики, медицины, системам контроля и управления доступом и др. Технический результат заключается в повышении достоверности и воспроизводимости оценок эмоционального состояния диктора. Способ заключается в записи речевого сигнала и его последующей обработке, включающей в себя расчет коэффициентов интегрального преобразования путем свертки речевого сигнала с ядром преобразования, и последующем анализе полученных коэффициентов на основе меры различимости. Коэффициентами интегрального преобразования являются коэффициенты локального вейвлет-спектра непрерывного вейвлет-преобразования речевого сигнала, и мерой различимости является евклидова невязка между локальными спектрами непрерывного вейвлет-преобразования. 1 з.п. ф-лы, 1 ил.

Способ определения риска развития заболеваний индивида по его голосу и аппаратно-программный комплекс для реализации способа // 2559689

Изобретение относится к медицине и предназначено для исследования функционального состояния голосовых складок. Техническим результатом является повышение точности диагностики состояния здоровья индивида по параметрам голосового сигнала. Комплекс содержит: терминальное устройство индивида с расположенными в нем модулем записи голосового сигнала индивида, модулем управления записью голосового сигнала, выполненным с возможностью выбора частоты дискретизации и длительности записи голосового сигнала, вычислительным модулем, выполненным с возможностью перевода записанного голосового сигнала из аналогового в цифровой сигнал, модулем отображения информации на мониторе терминального устройства индивида, полученной с блока анализа голосового сигнала, выполненного с возможностью определения для записанного голосового сигнала параметра, характеризующего нелинейность голосового сигнала, и по крайней мере одного параметра из группы, характеризующей эффект «Дрожания» (Jitter), и/или эффект «Мерцания» (Shimmer), и/или физиологические свойства голосовых складок, и/или уровень шума в голосовом сигнале, с последующим построением вектора в N-мерном пространстве параметров голосового сигнала индивида. 2 н. и 28 з.п. ф-лы, 18 ил., 3 табл.

Способ обработки функции автокорреляции для измерения основного тона речевого сигнала // 2559710

Изобретение относится к средствам обработки функции автокорреляции для измерения основного тона речевого сигнала и может быть использовано в области обработки сигналов, в системах распознавания речи. Технический результат заключается в повышении надежности измерения частоты основного тона речевого сигнала. Подчеркивают главный пик в автокорреляционной функции с помощью вычитания из автокорреляционной функции, полученной для сегмента сигнала, меньшей по амплитуде сглаженной функции автокорреляции для модуля сигнала на том же сегменте и обнуления отрицательных разностей. 1 з.п. ф-лы, 3 ил.