Способ аудиокодирования и соответствующее устройство

Изобретение относится к технологиям аудиокодирования. Технический результат заключается в повышении эффективности аудиокодирования. Технический результат достигается за счет осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио; получения одного или более опорных параметров кодирования текущего кадра аудио; и если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет любому одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием; или если полученный опорный параметр кодирования текущего кадра аудио не удовлетворяет ни одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества. 6 н. и 16 з.п. ф-лы, 10 ил.

 

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

[0002] Настоящее изобретение относится к технологиям аудиокодирования и, в частности, к способу аудиокодирования и соответствующему устройству.

УРОВЕНЬ ТЕХНИКИ

[0003] В существующем алгоритме кодирования аудиосигнала (например, музыки), при одинаковой битовой скорости, некоторые алгоритмы аудиокодирования ограничиваются конкретной полосой кодирования и, в основном используются для кодирования кадра аудио, имеющего относительно узкую полосу, и некоторые алгоритмы аудиокодирования не ограничиваются полосой кодирования и, в основном используются для кодирования кадра аудио, имеющего относительно широкую полосу. Конечно, обе категории алгоритмов аудиокодирования имеют достоинства и недостатки.

[0004] Однако, в уровне техники, в ходе кодирования кадра аудио, фиксированный алгоритм кодирования непосредственно используется для кодирования кадра аудио. Таким образом, используемый алгоритм аудиокодирования вряд ли может гарантировать высокое качество кодирования или высокую эффективность кодирования.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0005] Варианты осуществления настоящего изобретения предусматривают способ аудиокодирования и соответствующее устройство для повышения качества кодирования или эффективности кодирования при кодировании кадра аудио.

[0006] Первый аспект вариантов осуществления настоящего изобретения предусматривает способ аудиокодирования, включающий в себя:

осуществление обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;

получение опорного параметра кодирования текущего кадра аудио; и

если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.

[0007] Согласно первому аспекту, в первом возможном варианте реализации первого аспекта, опорный параметр кодирования включает в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, причем

наибольший элемент разрешения по частоте подполосы z больше, чем критический элемент F1 разрешения по частоте; наибольший элемент разрешения по частоте подполосы w больше, чем критический элемент F1 разрешения по частоте; наибольший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте; и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте;

диапазон значений критического элемента F1 разрешения по частоте составляет от 6,4 кГц до 12 кГц;

диапазон значений критического элемента F2 разрешения по частоте составляет от 4,8 кГц до 8 кГц; и

наибольший элемент разрешения по частоте подполосы i меньше, чем наибольший элемент разрешения по частоте подполосы j; наибольший элемент разрешения по частоте подполосы m меньше, чем наибольший элемент разрешения по частоте подполосы n; наибольший элемент разрешения по частоте подполосы x меньше или равен наименьшему элементу разрешения по частоте подполосы y; наибольший элемент разрешения по частоте подполосы p меньше или равен наименьшему элементу разрешения по частоте подполосы q; наибольший элемент разрешения по частоте подполосы r меньше или равен наименьшему элементу разрешения по частоте подполосы s; и наибольший элемент разрешения по частоте подполосы e меньше или равен наименьшему элементу разрешения по частоте подполосы f.

[0008] Согласно первому возможному варианту реализации первого аспекта, во втором возможном варианте реализации первого аспекта,

выполняется, по меньшей мере, одно из следующих условий: наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте.

[0009] Согласно первому возможному варианту реализации первого аспекта или второму возможному варианту реализации первого аспекта, в третьем возможном варианте реализации первого аспекта, первое условие параметра включает в себя, по меньшей мере, одно из следующих условий:

скорость кодирования текущего кадра аудио меньше, чем порог T1;

отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T2;

отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T3;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T4;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, больше или равна порогу T5;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T6;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, больше или равна порогу T7;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше или равно порогу T8;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, попадает в интервал R2;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше или равно порогу T9;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше или равно порогу T10; или

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, больше или равно порогу T11.

[0010] Согласно первому возможному варианту реализации первого аспекта, второму возможному варианту реализации первого аспекта или третьему возможному варианту реализации первого аспекта, в четвертом возможном варианте реализации первого аспекта, первое условие параметра включает в себя одно из следующих условий:

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T45;

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T47;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T49;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T51;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T53;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T55;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T57;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T59;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T61;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T63;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T65;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T67;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T69;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T71;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T73;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T75;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T77;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T79;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T81; или

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T83.

[0011] Согласно первому возможному варианту реализации первого аспекта, второму возможному варианту реализации первого аспекта, третьему возможному варианту реализации первого аспекта или четвертому возможному варианту реализации первого аспекта, в пятом возможном варианте реализации первого аспекта, второе условие параметра включает в себя, по меньшей мере, одно из следующих условий:

скорость кодирования текущего кадра аудио больше или равна порогу T1;

отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T2;

отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T3;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T4;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше, чем порог T5;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T6;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше, чем порог T7;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, не попадает в интервал R3;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10; или

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше, чем порог T11.

[0012] Согласно первому возможному варианту реализации первого аспекта, второму возможному варианту реализации первого аспекта, третьему возможному варианту реализации первого аспекта, четвертому возможному варианту реализации первого аспекта или пятому возможному варианту реализации первого аспекта, в шестом возможном варианте реализации первого аспекта, второе условие параметра включает в себя одно из следующих условий:

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T45;

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T47;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T49;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T51;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T53;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T55;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T57;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T59;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T61;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T63;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T65;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T67;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T69;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T71;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T73;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T75;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T77;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T79;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T81; или

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T83.

[0013] Согласно третьему возможному варианту реализации первого аспекта, четвертому возможному варианту реализации первого аспекта, пятому возможному варианту реализации первого аспекта или шестому возможному варианту реализации первого аспекта, в седьмом возможном варианте реализации первого аспекта,

выполняется, по меньшей мере, одно из следующих условий:

порог T2 больше или равен 2;

порог T4 меньше или равен 1/1,2;

интервал R1 составляет [1/2,25, 2,25];

порог T44 меньше или равен 1/2,56;

порог T45 больше или равен 1,5;

порог T46 больше или равен 1/2,56;

порог T47 меньше или равен 1,5;

порог T68 меньше или равен 1,25; или

порог T69 больше или равен 2.

[0014] Второй аспект вариантов осуществления настоящего изобретения предусматривает аудиокодер, включающий в себя:

блок временно-частотного преобразования, выполненный с возможностью осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;

блок получения, выполненный с возможностью получения опорного параметра кодирования текущего кадра аудио; и

блок кодирования, выполненный с возможностью: если опорный параметр кодирования, полученный блоком получения и относящийся к текущему кадру аудио, удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если опорный параметр кодирования, полученный блоком получения и относящийся к текущему кадру аудио, удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.

[0015] Согласно второму аспекту, в первом возможном варианте реализации второго аспекта, опорный параметр кодирования включает в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, причем

наибольший элемент разрешения по частоте подполосы z больше, чем критический элемент F1 разрешения по частоте; наибольший элемент разрешения по частоте подполосы w больше, чем критический элемент F1 разрешения по частоте; наибольший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте; и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте; диапазон значений критического элемента F1 разрешения по частоте составляет от 6,4 кГц до 12 кГц; и диапазон значений критического элемента F2 разрешения по частоте составляет от 4,8 кГц до 8 кГц; и

наибольший элемент разрешения по частоте подполосы i меньше, чем наибольший элемент разрешения по частоте подполосы j; наибольший элемент разрешения по частоте подполосы m меньше, чем наибольший элемент разрешения по частоте подполосы n; наибольший элемент разрешения по частоте подполосы x меньше или равен наименьшему элементу разрешения по частоте подполосы y; наибольший элемент разрешения по частоте подполосы p меньше или равен наименьшему элементу разрешения по частоте подполосы q; наибольший элемент разрешения по частоте подполосы r меньше или равен наименьшему элементу разрешения по частоте подполосы s; и наибольший элемент разрешения по частоте подполосы e меньше или равен наименьшему элементу разрешения по частоте подполосы f.

[0016] Согласно первому возможному варианту реализации второго аспекта, во втором возможном варианте реализации второго аспекта, выполняется, по меньшей мере, одно из следующих условий: наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте.

[0017] Согласно первому возможному варианту реализации второго аспекта или второму возможному варианту реализации второго аспекта, в третьем возможном варианте реализации второго аспекта, первое условие параметра включает в себя, по меньшей мере, одно из следующих условий:

скорость кодирования текущего кадра аудио меньше, чем порог T1;

отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T2;

отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T3;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T4;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, больше или равна порогу T5;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T6;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, больше или равна порогу T7;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше или равно порогу T8;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, попадает в интервал R2;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше или равно порогу T9;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше или равно порогу T10; или

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, больше или равно порогу T11.

[0018] Согласно первому возможному варианту реализации второго аспекта, второму возможному варианту реализации второго аспекта или третьему возможному варианту реализации второго аспекта, в четвертом возможном варианте реализации второго аспекта, первое условие параметра включает в себя одно из следующих условий:

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T45;

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T47;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T49;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T51;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T53;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T55;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T57;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T59;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T61;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T63;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T65;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T67;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T69;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T71;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T73;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T75;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T77;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T79;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T81; или

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T83.

[0019] Согласно первому возможному варианту реализации второго аспекта, второму возможному варианту реализации второго аспекта, третьему возможному варианту реализации второго аспекта или четвертому возможному варианту реализации второго аспекта, в пятом возможном варианте реализации второго аспекта, второе условие параметра включает в себя, по меньшей мере, одно из следующих условий:

скорость кодирования текущего кадра аудио больше или равна порогу T1;

отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T2;

отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T3;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T4;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше, чем порог T5;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T6;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше, чем порог T7;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, не попадает в интервал R3;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10; или

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше, чем порог T11.

[0020] Согласно первому возможному варианту реализации второго аспекта, второму возможному варианту реализации второго аспекта, третьему возможному варианту реализации второго аспекта, четвертому возможному варианту реализации второго аспекта или пятому возможному варианту реализации второго аспекта, в шестом возможном варианте реализации второго аспекта, второе условие параметра включает в себя одно из следующих условий:

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T45;

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T47;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T49;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T51;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T53;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T55;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T57;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T59;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T61;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T63;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T65;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T67;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T69;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T71;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T73;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T75;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T77;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T79;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T81; или

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T83.

[0021] Согласно третьему возможному варианту реализации второго аспекта, четвертому возможному варианту реализации второго аспекта, пятому возможному варианту реализации второго аспекта или шестому возможному варианту реализации второго аспекта, в седьмом возможном варианте реализации второго аспекта,

выполняется, по меньшей мере, одно из следующих условий:

порог T2 больше или равен 2;

порог T4 меньше или равен 1/1,2;

интервал R1 составляет [1/2,25, 2,25];

порог T44 меньше или равен 1/2,56;

порог T45 больше или равен 1,5;

порог T46 больше или равен 1/2,56;

порог T47 меньше или равен 1,5;

порог T68 меньше или равен 1,25; или

порог T69 больше или равен 2.

[0022] Как можно видеть, в технических решений в некоторых вариантах осуществления настоящего изобретения, после получения опорного параметра кодирования текущего кадра аудио, алгоритм TCX или алгоритм HQ выбирается на основании полученного опорного параметра кодирования текущего кадра аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Опорный параметр кодирования текущего кадра аудио связан с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0023] Для более наглядного описания технических решений согласно вариантам осуществления настоящего изобретения, ниже кратко перечислены прилагаемые чертежи, необходимые для описания вариантов осуществления. Очевидно, прилагаемые чертежи в нижеследующем описании демонстрируют лишь некоторые варианты осуществления настоящего изобретения, и специалисты в данной области техники могут вывести другие чертежи из этих прилагаемых чертежей без применения творческих способностей.

[0024] Фиг. 1-8 - блок-схемы операций нескольких способов аудиокодирования согласно вариантам осуществления настоящего изобретения; и

[0025] Фиг. 9 и фиг. 10 - схемы двух типов аудиокодеров согласно вариантам осуществления настоящего изобретения.

ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

[0026] Варианты осуществления настоящего изобретения предусматривают способ аудиокодирования и соответствующее устройство для повышения качества кодирования или эффективности кодирования при кодировании кадра аудио.

[0027] Чтобы специалисты в данной области техники могли лучше понять технические решения в настоящем изобретении, ниже отчетливо описаны технические решения согласно вариантам осуществления настоящего изобретения со ссылкой на прилагаемые чертежи согласно вариантам осуществления настоящего изобретения. Очевидно, описанные варианты осуществления представляют собой лишь часть, а не все из вариантов осуществления настоящего изобретения. Все остальные варианты осуществления, полученные специалистами в данной области техники на основании вариантов осуществления настоящего изобретения без применения творческих способностей подлежат включению в объем защиты настоящего изобретения.

[0028] Ниже приведено подробное описание.

[0029] В описании изобретения, формуле изобретения и прилагаемых чертежах настоящего изобретения, термины "первый", "второй", "третий", "четвертый" и т.д. предназначены для различения между разными объектами, но не предназначены для описания конкретного порядка. Кроме того, термины "включают в себя" и "имеют" и любая их вариация призваны охватывать неисключающее включение. Например, процесс, способ, система, продукт или устройство, которые включают в себя несколько этапов или блоков, не ограничивается перечисленными этапам или блоками, но, в необязательном порядке, дополнительно включает в себя неперечисленный этап или блок или, в необязательном порядке, дополнительно включает в себя другой внутренний этап или блок процесса, способа, продукта или устройства.

[0030] Рассмотрим способ аудиокодирования, предусмотренный согласно вариантам осуществления настоящего изобретения. Способ аудиокодирования, предусмотренный согласно вариантам осуществления настоящего изобретения может выполняться аудиокодером. Аудиокодер может представлять собой любое устройство, которое необходимо для сбора, сохранения или передачи аудиосигнала, например, мобильный телефон, планшетный компьютер, персональный компьютер или компьютер-ноутбук.

[0031] В одном варианте осуществления способа аудиокодирования в настоящем изобретении, способ аудиокодирования включает в себя: осуществление обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио; получение опорного параметра кодирования текущего кадра аудио; и если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.

[0032] На фиг. 1 показана блок-схема операций способа аудиокодирования согласно варианту осуществления настоящего изобретения. Как показано на фиг. 1, способ аудиокодирования, предусмотренный в этом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0033] 101: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0034] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0035] 102: Получать опорный параметр кодирования текущего кадра аудио.

[0036] 103: Если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с возбуждением, кодированным преобразованием (по-английски: transform coded excitation, сокращенно TCX).

[0037] 104: Если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества (по-английски: high quality transform coding, сокращенно HQ).

[0038] Как можно видеть, в решениях этого варианта осуществления, после получения опорного параметра кодирования текущего кадра аудио, алгоритм TCX или алгоритм HQ выбирается на основании полученного опорного параметра кодирования текущего кадра аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Опорный параметр кодирования текущего кадра аудио связан с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0039] В алгоритме TCX, обработка изъятия обычно осуществляется на сигнале временной области текущего кадра аудио. Например, квадратный зеркальный фильтр используется для осуществления обработки изъятия на сигнале временной области текущего кадра аудио. В алгоритме HQ, обработка изъятия не осуществляется на сигнале временной области текущего кадра аудио.

[0040] Согласно требованию сценария применения, опорный параметр кодирования, полученный на этапе 102, текущего кадра аудио может изменяться.

[0041] Например, опорный параметр кодирования может включать в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио.

[0042] Большее значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио указывает более сильную спектральную корреляцию между спектральными коэффициентами, расположенными в подполосе p, и спектральными коэффициентами, расположенными в подполосе q. Значение параметра спектральной корреляции может быть, например, значением параметра нормализованной кросс-корреляции.

[0043] Диапазоны элемента разрешения по частоте подполос могут определяться согласно фактическим потребностям.

[0044] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы z может быть больше критического элемента F1 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы w может быть больше критического элемента F1 разрешения по частоте. Диапазон значений критического элемента F1 разрешения по частоте может составлять, например, от 6,4 кГц до 12 кГц. Например, значение критического элемента F1 разрешения по частоте может быть равно 6,4 кГц, 8 кГц, 9 кГц, 10 кГц или 12 кГц. Конечно, критический элемент F1 разрешения по частоте может иметь другое значение.

[0045] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы j может быть больше критического элемента F2 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте. Например, диапазон значений критического элемента F2 разрешения по частоте может составлять от 4,8 кГц до 8 кГц. В частности, например, значение критического элемента F2 разрешения по частоте может быть равно 6,4 кГц, 4,8 кГц, 6 кГц, 8 кГц, 5 кГц или 7 кГц. Конечно, критический элемент F2 разрешения по частоте может иметь другое значение.

[0046] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы i может быть меньше наибольшего элемента разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m может быть меньше наибольшего элемента разрешения по частоте подполосы n, наибольший элемент разрешения по частоте подполосы x может быть меньше или равен наименьшему элементу разрешения по частоте подполосы y, наибольший элемент разрешения по частоте подполосы p может быть меньше или равен наименьшему элементу разрешения по частоте подполосы q, наибольший элемент разрешения по частоте подполосы r может быть меньше или равен наименьшему элементу разрешения по частоте подполосы s, и наибольший элемент разрешения по частоте подполосы e может быть меньше или равен наименьшему элементу разрешения по частоте подполосы f.

[0047] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий:

наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы m меньше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте.

[0048] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий: наибольший элемент разрешения по частоте подполосы e меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы x меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы p меньше или равен критическому элементу F2 разрешения по частоте, или наибольший элемент разрешения по частоте подполосы r меньше или равен критическому элементу F2 разрешения по частоте.

[0049] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы f может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы f может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы q может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы q может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы s может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы s может быть больше или равен критическому элементу F2 разрешения по частоте.

[0050] Например, диапазон значений наибольшего элемента разрешения по частоте подполосы z может составлять от 12 кГц до 16 кГц. Диапазон значений наименьшего элемента разрешения по частоте подполосы z может составлять от 8 кГц до 14 кГц. Диапазон значений полосы подполосы z может составлять от 1,6 кГц до 8 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы z может составлять от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц или от 12 кГц до 14 кГц. Конечно, диапазон элемента разрешения по частоте подполосы z не ограничивается вышеприведенными примерами.

[0051] Например, диапазон элемента разрешения по частоте подполосы w может определяться согласно фактическим потребностям. Например, диапазон значений наибольшего элемента разрешения по частоте подполосы w может составлять от 12 кГц до 16 кГц, и диапазон значений наименьшего элемента разрешения по частоте подполосы w может составлять от 8 кГц до 14 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы w составляет от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц, от 12 кГц до 14 кГц или от 12,2 кГц до 14,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы w не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы w может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы z.

[0052] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы i не ограничивается вышеприведенными примерами.

[0053] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы j не ограничивается вышеприведенными примерами.

[0054] Например, диапазон элемента разрешения по частоте подполосы m может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы m не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы m может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы i.

[0055] Например, диапазон элемента разрешения по частоте подполосы n может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы n не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы n может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы j.

[0056] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2 кГц до 3,2 кГц или от 2,5 кГц до 3,4 кГц. Конечно, диапазон элемента разрешения по частоте подполосы x не ограничивается вышеприведенными примерами.

[0057] Например, диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,4 кГц до 6,4 кГц или от 4,5 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы y не ограничивается вышеприведенными примерами.

[0058] Например, диапазон элемента разрешения по частоте подполосы p может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,1 кГц до 3,2 кГц или от 2,5 кГц до 3,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы p не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы p может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0059] Например, диапазон элемента разрешения по частоте подполосы q может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,2 кГц до 6,4 кГц или от 4,7 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы q не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы q может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0060] Например, диапазон элемента разрешения по частоте подполосы r может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,05 кГц до 3,27 кГц или от 2,59 кГц до 3,51 кГц. Конечно, диапазон элемента разрешения по частоте подполосы r не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы r может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0061] Например, диапазон элемента разрешения по частоте подполосы s может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,4 кГц до 7,1 кГц или от 4,55 кГц до 6,29 кГц. Конечно, диапазон элемента разрешения по частоте подполосы s не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы s может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0062] Например, диапазон элемента разрешения по частоте подполосы e может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 0,8 кГц до 3 кГц или от 1,9 кГц до 3,8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы e не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы e может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0063] Например, диапазон элемента разрешения по частоте подполосы f может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,3 кГц до 7,15 кГц или от 4,58 кГц до 6,52 кГц. Конечно, диапазон элемента разрешения по частоте подполосы f не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы f может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0064] Первое условие параметра может изменяться.

[0065] Например, в некоторых возможных вариантах реализации настоящего изобретения, первое условие параметра, например, может включать в себя, по меньшей мере, одно из следующих условий:

скорость кодирования текущего кадра аудио меньше, чем порог T1 (порог T1 может быть, например, больше или равен 24,4 кбит/с, 32 кбит/с, 64 кбит/с или другой скорости);

отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T2 (порог T2 может быть, например, больше или равен 1, 2, 3, 5 или другому значению);

отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T3 (порог T3 может быть, например, больше или равен 10, 20, 35 или другому значению);

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T4 (порог T4 может быть, например, больше или равен 0,5, 1, 2, 3 или другому значению);

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, больше или равна порогу T5 (порог T5 может быть, например, больше или равен 10, 20, 51, 100 или другому значению);

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T6 (порог T6 может быть, например, больше или равен 0,5, 1,1, 2, 3 или другому значению);

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, больше или равна порогу T7 (порог T7 может быть, например, больше или равен 11, 20, 50, 101 или другому значению);

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1 (интервал R1 может быть равен, например, [0,5, 2], [0,4, 2,5] или другому значению);

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше или равно порогу T8 (порог T8 может быть, например, больше или равен 1, 2, 3 или другому значению);

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, попадает в интервал R2 (интервал R2 может быть равен, например, [0,5, 2], [0,4, 2,5] или другому значению);

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше или равно порогу T9 (порог T9 может быть, например, больше или равен 10, 20, 35 или другому значению);

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3 (интервал R3 может быть равен, например, [0,5, 2], [0,4, 2,5] или другому значению);

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше или равно порогу T10 (порог T10 может быть, например, больше или равен 11, 20, 50, 101 или другому значению); или

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, больше или равно порогу T11 (порог T11 может быть равен, например, 0,5, 0,8, 0,9, 1, или другому значению).

[0066] В порядке другого примера, в некоторых возможных вариантах реализации настоящего изобретения, первое условие параметра, например, может включать в себя одно из следующих условий:

скорость кодирования текущего кадра аудио больше или равна порогу T1, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T12 (порог T12 может быть, например, больше или равен порогу T4, и порог T12 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

скорость кодирования текущего кадра аудио больше или равна порогу T1, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T13 (порог T13 может быть, например, больше или равен порогу T6, и порог T13 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

скорость кодирования текущего кадра аудио больше или равна порогу T1, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T14 (порог T14 может быть, например, меньше или равен порогу T2, и порог T14 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4 или другому значению);

скорость кодирования текущего кадра аудио больше или равна порогу T1, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T15 (порог T15 может быть, например, меньше или равен порогу T3, и порог T15 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T16 (порог T16 может быть, например, больше или равен порогу T4, и порог T16 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T17 (порог T17 может быть, например, больше или равен порогу T6, и порог T17 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T18 (порог T18 может быть, например, меньше или равен порогу T2, и порог T18 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T19 (порог T19 может быть, например, меньше или равен порогу T3, и порог T19 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T20 (порог T20 может быть, например, больше или равен порогу T4, и порог T20 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T21 (порог T21 может быть, например, больше или равен порогу T6, и порог T21 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T22 (порог T22 может быть, например, меньше или равен порогу T2, и порог T22 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T23 (порог T23 может быть, например, меньше или равен порогу T3, и порог T23 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T24 (порог T24 может быть, например, больше или равен порогу T4, и порог T24 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T25 (порог T25 может быть, например, больше или равен порогу T6, и порог T25 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T26 (порог T26 может быть, например, меньше или равен порогу T2, и порог T26 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T27 (порог T27 может быть, например, меньше или равен порогу T3, и порог T27 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T28 (порог T28 может быть, например, больше или равен порогу T4, и порог T28 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T29 (порог T29 может быть, например, больше или равен порогу T6, и порог T29 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T30 (порог T30 может быть, например, меньше или равен порогу T2, и порог T30 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T31 (порог T31 может быть, например, меньше или равен порогу T3, и порог T31 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T32 (порог T32 может быть, например, больше или равен порогу T4, и порог T32 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T33 (порог T33 может быть, например, больше или равен порогу T6, и порог T33 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T34 (порог T34 может быть, например, меньше или равен порогу T2, и порог T34 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T35 (порог T35 может быть, например, меньше или равен порогу T3, и порог T35 может быть, например, меньше или равен 5, 8, 9,5, 10, 15, 20 или другому значению);

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T36 (порог T36 может быть, например, больше или равен порогу T4, и порог T36 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T37 (порог T37 может быть, например, больше или равен порогу T6, и порог T37 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T38 (порог T38 может быть, например, меньше или равен порогу T2, и порог T38 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T39 (порог T39 может быть, например, меньше или равен порогу T3, и порог T39 может быть, например, меньше или равен 5, 8, 9,5, 10, 15, 20 или другому значению);

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T40 (порог T40 может быть, например, больше или равен порогу T4, и порог T40 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T41 (порог T41 может быть, например, больше или равен порогу T6, и порог T41 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T42 (порог T42 может быть, например, меньше или равен порогу T2, и порог T42 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T43 (порог T43 может быть, например, меньше или равен порогу T3, и порог T43 может быть, например, меньше или равен 5, 8, 9,5, 10, 15, 20 или другому значению);

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44 (диапазон значений порога T44 может составлять, например, от 1,5 до 3), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T45 (диапазон значений порога T45 может составлять, например, от 1 до 3);

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46 (диапазон значений порога T46 может составлять, например, от 1,5 до 3), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T47 (диапазон значений порога T47 может составлять, например, от 1 до 3);

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48 (диапазон значений порога T48 может составлять, например, от -1 до 3), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T49 (диапазон значений порога T49 может составлять, например, от 1 до 3);

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50 (диапазон значений порога T50 может составлять, например, от -1 до 3), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T51 (диапазон значений порога T51 может составлять, например, от 1 до 3);

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52 (диапазон значений порога T52 может составлять, например, от 1 до 3), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T53 (порог T53 может быть равен, например, 10, 20, 30 или другому значению);

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54 (диапазон значений порога T54 может составлять, например, от 1 до 3), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T55 (порог T55 может быть равен, например, 10, 20, 30 или другому значению);

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56 (диапазон значений порога T56 может составлять, например, от -40 до 40), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T57 (порог T57 может быть равен, например, 10, 20, 30 или другому значению);

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58 (диапазон значений порога T58 может составлять, например, от -40 до 40), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T59 (порог T59 может быть равен, например, 10, 20, 30 или другому значению);

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60 (диапазон значений порога T60 может составлять, например, от 1 до 3), и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T61 (порог T61 может быть равен, например, 10, 20, 30 или другому значению);

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62 (диапазон значений порога T62 может составлять, например, от 1 до 3), и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T63 (порог T63 может быть равен, например, 10, 20, 30 или другому значению);

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64 (диапазон значений порога T64 может составлять, например, от -40 до 40), и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T65 (порог T65 может быть равен, например, 10, 20, 30 или другому значению);

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66 (диапазон значений порога T66 может составлять, например, от -40 до 40), и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T67 (порог T67 может быть равен, например, 10, 20, 30 или другому значению);

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68 (порог T68 может быть, например, меньше или равен 0,5, 1, 2, 3 или другому значению), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T69 (порог T69 может быть, например, меньше или равен 1, 2, 3, 5 или другому значению);

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70 (порог T70 может быть, например, меньше или равен 10, 20, 51, 100 или другому значению), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T71 (порог T71 может быть, например, меньше или равен 1, 2, 3, 5 или другому значению);

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72 (порог T72 может быть, например, больше или равен 0,5, 1,1, 2, 3 или другому значению), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T73 (порог T73 может быть, например, меньше или равен 1, 2, 3, 5 или другому значению);

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74 (порог T74 может быть, например, больше или равен 11, 20, 50, 101 или другому значению), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T75 (порог T75 может быть, например, меньше или равен 1, 2, 3, 5 или другому значению);

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76 (порог T76 может быть, например, меньше или равен 0,5, 1, 2, 3 или другому значению), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T77 (порог T77 может быть, например, больше или равен 10, 20, 35 или другому значению);

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78 (порог T78 может быть, например, меньше или равен 10, 20, 51, 100 или другому значению), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T79 (порог T79 может быть, например, больше или равен 10, 20, 35 или другому значению);

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80 (порог T80 может быть, например, больше или равен 0,5, 1,1, 2, 3 или другому значению), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T81 (порог T81 может быть, например, больше или равен 10, 20, 35 или другому значению); или

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82 (порог T82 может быть, например, больше или равен 11, 20, 50, 101 или другому значению), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T83 (порог T83 может быть, например, больше или равен 10, 20, 35 или другому значению).

[0067] Очевидно, что первое условие параметра не ограничивается вышеприведенными примерами, и некоторые другие возможные варианты реализации можно расширять на основании вышеприведенных примеров.

[0068] Например, в некоторых возможных вариантах реализации настоящего изобретения, второе условие параметра включает в себя, по меньшей мере, одно из следующих условий:

скорость кодирования текущего кадра аудио больше или равна порогу T1;

отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T2;

отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T3;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T4;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше, чем порог T5;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T6;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше, чем порог T7;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, не попадает в интервал R3;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10; или

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше, чем порог T11.

[0069] В порядке другого примера, в некоторых возможных вариантах реализации настоящего изобретения, второе условие параметра включает в себя одно из следующих условий:

скорость кодирования текущего кадра аудио больше или равна порогу T1, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T12;

скорость кодирования текущего кадра аудио больше или равна порогу T1, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T13;

скорость кодирования текущего кадра аудио больше или равна порогу T1, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T14;

скорость кодирования текущего кадра аудио больше или равна порогу T1, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T15;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T16;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T17;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T18;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T19;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T20;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T21;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T22;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T23;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T24;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T25;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T26;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T27;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T28;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T29;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T30;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T31;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T32;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T33;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T34;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T35;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T36;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T37;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T38;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T39;

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T40;

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T41;

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T42;

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T43;

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T45;

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T47;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T49;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T51;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T53;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T55;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T57;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T59;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T61;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T63;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T65;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T67;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T69;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T71;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T73;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T75;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T77;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T79;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T81; или

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T83.

[0070] Очевидно, что второе условие параметра не ограничивается вышеприведенными примерами, и некоторые другие возможные варианты реализации можно расширять на основании вышеприведенных примеров.

[0071] Очевидно, что примеры первого условия параметра и второго условия параметра являются не всеми возможными вариантами реализации. В фактическом применении, вышеприведенные примеры можно расширять, для обогащения возможных вариантов реализации первого условия параметра и второго условия параметра.

[0072] Для лучшего понимания вариантов осуществления настоящего изобретения, ниже приведено иллюстративное описание согласно некоторым конкретным сценариям применения.

[0073] На фиг. 2 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 2, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0074] Как показано на фиг. 2, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0075] 201: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0076] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0077] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.

[0078] Обработка временно-частотного преобразования осуществляется на сигнале временной области текущего кадра аудио с использованием алгоритма быстрого преобразования Фурье (по-английски: fast fourier transform, сокращенно FFT), алгоритма модифицированного дискретного косинусного преобразования (по-английски: modified discrete cosine transform, сокращенно MDCT), или другого алгоритма временно-частотного преобразования, для получения спектральных коэффициентов текущего кадра аудио.

[0079] 202: Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0080] 203: Определять, больше или равно ли порогу T4 частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0081] Если да, осуществляется этап 204; если нет, осуществляется этап 205.

[0082] Порог T4 может быть больше или равен 0,5, и порог T4, например, равен 0,5, 1, 1,5, 2, 3 или другому значению.

[0083] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц или от 0,4 кГц до 6,4 кГц.

[0084] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц или от 4,8 кГц до 9,6 кГц.

[0085] 204: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.

[0086] 205: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.

[0087] Как можно видеть, в решениях этого варианта осуществления, после получения среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, алгоритм TCX или алгоритм HQ выбирается на основании полученного среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и полученного среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Соотношение между средним по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио и средним по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, связано с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0088] На фиг. 3 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 3, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио.

[0089] Как показано на фиг. 3, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0090] 301: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0091] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0092] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.

[0093] 302: Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0094] 303: Определять, больше или равно ли частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, порогу T68.

[0095] Если нет, осуществляется этап 304; если да, осуществляется этап 306.

[0096] Порог T68 больше или равен порогу T4. Например, порог T68 может быть больше или равен 0,6, и порог T68, например, равен 0,8, 0,6, 1, 1,5, 2, 3, 5 или другому значению.

[0097] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц или от 0,4 кГц до 6,4 кГц.

[0098] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц или от 4,8 кГц до 9,6 кГц.

[0099] 304: Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио.

[00100] 305: Определять, ли отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T69.

[0100] Если да, осуществляется этап 307; если нет, осуществляется этап 306.

[0101] Порог T69 может быть больше или равен 1, и порог T69, например, равен 1, 1,1, 1,5, 2, 3,5, 6, 4,6 или другому значению.

[0102] Например, диапазон значений наибольшего элемента разрешения по частоте подполосы z может составлять от 12 кГц до 16 кГц, и диапазон значений наименьшего элемента разрешения по частоте подполосы z может составлять от 8 кГц до 14 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы z может составлять от 8 кГц до 12 кГц, от 9 кГц до 11 кГц или от 8 кГц до 9,6 кГц.

[0103] 306: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.

[0104] 307: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.

[0105] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Соотношение между средним по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио и средним по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0106] На фиг. 4 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 4, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.

[0107] Как показано на фиг. 4, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0108] 401: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0109] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0110] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.

[0111] 402: Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.

[0112] 403: Определять, ли отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1.

[0113] Если да, осуществляется этап 404; если нет, осуществляется этап 405.

[0114] Интервал R1 может представлять собой, например, [0,5, 2], [0,8, 1,25], [0,4, 2,5] или другой диапазон.

[0115] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц или от 1,6 кГц до 3,2 кГц, и диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц или от 4,8 кГц до 6,4 кГц.

[0116] 404: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.

[0117] 405: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.

[0118] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0119] На фиг. 5 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 5, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.

[0120] Как показано на фиг. 5, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0121] 501: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0122] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0123] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.

[0124] 502: Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.

[0125] 503: Определять, больше или равно ли частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, порогу T46.

[0126] Если да, осуществляется этап 504; если нет, осуществляется этап 505.

[0127] порог T46 может быть больше или равен 0,5, и порог T46, например, равен 0,5, 1, 1,5, 2, 3 или другому значению.

[0128] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц или от 1,6 кГц до 3,2 кГц, и диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц или от 4,8 кГц до 6,4 кГц.

[0129] 504: Определять, ли отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше или равно порогу T47.

[0130] Если да, осуществляется этап 506; если нет, осуществляется этап 507.

[0131] 505: Определять, меньше ли отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, чем порог T47.

[0132] Если да, осуществляется этап 506; если нет, осуществляется этап 507.

[0133] 506: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.

[0134] 507: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.

[0135] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0136] На фиг. 6 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 6, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0137] Как показано на фиг. 6, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0138] 601: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0139] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0140] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.

[0141] 602: Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.

[0142] 603: Определять, ли отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1.

[0143] Если нет, осуществляется этап 604; если да, осуществляется этап 606.

[0144] Интервал R1 может представлять собой, например, [0,5, 2], [0,8, 1,25], [0,4, 2,5] или другой диапазон.

[0145] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц или от 1,6 кГц до 3,2 кГц, и диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц или от 4,8 кГц до 6,4 кГц.

[0146] 604: Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0147] 605: Определять, больше или равно ли частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, порогу T16.

[0148] Если да, осуществляется этап 606; если нет, осуществляется этап 607.

[0149] Диапазон элемента разрешения по частоте подполосы i может составлять, например, от 0 кГц до 1,6 кГц или от 1 кГц до 2,6 кГц, и диапазон элемента разрешения по частоте подполосы j может составлять, например, от 6,4 кГц до 8 кГц, от 4,8 кГц до 6,4 кГц или от 7,4 кГц до 9 кГц.

[0150] Порог T16 больше, чем порог T4. Например, порог T16 может быть больше или равен 2, и порог T16, например, равен 2, 2,5, 3, 3,5, 5, 5, 1, или другому значению.

[0151] 606: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.

[0152] 607: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.

[0153] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0154] На фиг. 7 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 7, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, с использованием скорости кодирования текущего кадра аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0155] Как показано на фиг. 7, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0156] 701: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0157] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0158] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.

[0159] 702: Определять, больше или равна ли скорость кодирования текущего кадра аудио порогу T1.

[0160] Если да, осуществляется этап 703; если нет, осуществляется этап 705.

[0161] Порог T1, например, больше или равен 24,4 кбит/с. Например, порог T1 равен 24,4 кбит/с, 32 кбит/с, 64 кбит/с или другой скорости.

[0162] 703: Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0163] 704: Определять, больше или равно ли частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, порогу T12.

[0164] Если да, осуществляется этап 705; если нет, осуществляется этап 706.

[0165] Диапазон элемента разрешения по частоте подполосы i может составлять, например, от 0 кГц до 1,6 кГц или от 1 кГц до 2,6 кГц, и диапазон элемента разрешения по частоте подполосы j может составлять, например, от 6,4 кГц до 8 кГц, от 4,8 кГц до 6,4 кГц или от 7,4 кГц до 9 кГц.

[0166] Порог T12 может быть больше порога T4. Например, порог T12 может быть больше или равен 2, и порог T12, например, равен 2, 2,5, 3, 3,5, 5, 5,2 или другому значению.

[0167] 705: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.

[0168] 706: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.

[0169] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании скорости кодирования текущего кадра аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Скорость кодирования текущего кадра аудио, среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0170] На фиг. 8 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 8, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио.

[0171] Как показано на фиг. 8, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0172] 801: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0173] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0174] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.

[0175] 802: Получать среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио и среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио.

[0176] 803: Определять, больше или равно ли порогу T6 частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио.

[0177] Если да, осуществляется этап 804; если нет, осуществляется этап 805.

[0178] Порог T6 может быть больше или равен 0,3, и порог T6, например, равен 0,5, 1, 1,5, 2, 3,2, или другому значению.

[0179] Например, диапазон элемента разрешения по частоте подполосы m может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц или от 0,4 кГц до 6,4 кГц.

[0180] Например, диапазон элемента разрешения по частоте подполосы n может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц или от 4,8 кГц до 9,6 кГц.

[0181] 804: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.

[0182] 805: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.

[0183] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Соотношение между средним по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и средним по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0184] Очевидно, что иллюстративные варианты реализации, представленные на фиг. 2-8, являются лишь некоторыми вариантами реализации настоящего изобретения. В фактическом применении, многие другие возможные варианты реализации могут расширяться на основании соответствующих иллюстративных описаний согласно варианту осуществления, соответствующему фиг. 1.

[0185] В некоторых сценариях, в ходе выбора подполосы можно рассматривать следующее.

[0186] При вычислении сходства между параметрами свойства спектральных коэффициентов, расположенных в двух подполосах, можно выбирать две согласованные подполосы, например, две подполосы составляют от 0 кГц до 1,6 кГц и от 6,4 кГц до 8 кГц. В некоторых сценариях, поскольку свойство спектральных коэффициентов в пределах от 0 до 1 кГц значительно отличается от свойства спектральных коэффициентов в пределах от 1 до 1,6 кГц, спектр от 0 кГц до 1,6 кГц может не выбираться при вычислении сходства между параметрами свойства спектральных коэффициентов. Например, спектральные коэффициенты в пределах от 1 кГц до 2,6 кГц можно выбирать для замены спектральных коэффициентов в пределах от 0 до 1,6 кГц, для вычисления параметра свойства низкочастотных спектральных коэффициентов. В этом случае, если низкочастотные спектральные коэффициенты в пределах от 1 кГц до 2,6 кГц копируются в высокую частоту, соответствующие спектральные коэффициенты являются высокочастотными спектральными коэффициентами в пределах от 7,4 кГц до 9 кГц. При вычислении параметра свойства высокочастотных спектральных коэффициентов, спектральные коэффициенты в пределах от 7,4 кГц до 9 кГц более пригодны для вычисления спектрального свойства. Однако, в некоторых сценариях, разрешение спектральных коэффициентов в пределах от 0 кГц до 6,4 кГц может быть очень высоким, и спектральные коэффициенты в пределах от 0 кГц до 6,4 кГц пригодны для вычисления параметра свойства. Если разрешение спектральных коэффициентов в пределах от 6,4 кГц до 16 кГц относительно низко, спектральные коэффициенты в пределах от 6,4 кГц до 16 кГц могут быть не пригодны для вычисления параметра свойства спектральных коэффициентов. Поэтому, при вычислении параметра свойства высокочастотных спектральных коэффициентов, для вычисления параметра свойства можно выбирать спектральные коэффициенты в пределах от 4,8 кГц до 6,4 кГц, и параметр свойства используется в качестве высокочастотного параметра свойства.

[0187] Кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием может, в частности, включать в себя: деление спектральных коэффициентов на N подполос; вычисление и квантование огибающей каждой подполосы; осуществление выделение битов для каждой подполосы согласно квантованному значению огибающей и количеству доступных битов; квантование спектральные коэффициенты каждой подполосы согласно количеству битов, выделенных подполосе; и запись квантованных спектральных коэффициентов и значение индекса спектральной огибающей в битовый поток.

[0188] Ниже дополнительно представлено соответствующее устройство, выполненное с возможностью реализации вышеприведенного решения.

[0189] Согласно фиг. 9, вариант осуществления настоящего изобретения дополнительно предусматривает аудиокодер 900. Аудиокодер 900 может включать в себя блок 910 временно-частотного преобразования, блок 920 получения и блок 930 кодирования.

[0190] Блок 910 временно-частотного преобразования выполнен с возможностью осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0191] Блок 920 получения выполнен с возможностью получения опорного параметра кодирования текущего кадра аудио.

[0192] Блок 930 кодирования выполнен с возможностью: если опорный параметр кодирования, полученный блоком 920 получения и относящийся к текущему кадру аудио, удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если опорный параметр кодирования, полученный блоком получения и относящийся к текущему кадру аудио, удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.

[0193] Согласно требованию сценария применения, опорный параметр кодирования, полученный блоком 920 получения и относящийся к текущему кадру аудио, может изменяться.

[0194] Например, опорный параметр кодирования может включать в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио.

[0195] Большее значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио указывает более сильную спектральную корреляцию между спектральными коэффициентами, расположенными в подполосе p, и спектральными коэффициентами, расположенными в подполосе q. Значение параметра спектральной корреляции может быть, например, значением параметра нормализованной кросс-корреляции.

[0196] Диапазоны элемента разрешения по частоте подполос могут определяться согласно фактическим потребностям.

[0197] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы z может быть больше критического элемента F1 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы w может быть больше критического элемента F1 разрешения по частоте. Диапазон значений критического элемента F1 разрешения по частоте может составлять, например, от 6,4 кГц до 12 кГц. Например, значение критического элемента F1 разрешения по частоте может быть равно 6,4 кГц, 8 кГц, 9 кГц, 10 кГц или 12 кГц. Конечно, критический элемент F1 разрешения по частоте может иметь другое значение.

[0198] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы j может быть больше критического элемента F2 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте. Например, диапазон значений критического элемента F2 разрешения по частоте может составлять от 4,8 кГц до 8 кГц. В частности, например, значение критического элемента F2 разрешения по частоте может быть равно 6,4 кГц, 4,8 кГц, 6 кГц, 8 кГц, 5 кГц или 7 кГц. Конечно, критический элемент F2 разрешения по частоте может иметь другое значение.

[0199] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы i может быть меньше наибольшего элемента разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m может быть меньше наибольшего элемента разрешения по частоте подполосы n, наибольший элемент разрешения по частоте подполосы x может быть меньше или равен наименьшему элементу разрешения по частоте подполосы y, наибольший элемент разрешения по частоте подполосы p может быть меньше или равен наименьшему элементу разрешения по частоте подполосы q, наибольший элемент разрешения по частоте подполосы r может быть меньше или равен наименьшему элементу разрешения по частоте подполосы s, и наибольший элемент разрешения по частоте подполосы e может быть меньше или равен наименьшему элементу разрешения по частоте подполосы f.

[0200] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий:

наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы m меньше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте.

[0201] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий: наибольший элемент разрешения по частоте подполосы e меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы x меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы p меньше или равен критическому элементу F2 разрешения по частоте, или наибольший элемент разрешения по частоте подполосы r меньше или равен критическому элементу F2 разрешения по частоте.

[0202] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы f может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы f может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы q может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы q может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы s может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы s может быть больше или равен критическому элементу F2 разрешения по частоте.

[0203] Например, диапазон значений наибольшего элемента разрешения по частоте подполосы z может составлять от 12 кГц до 16 кГц. Диапазон значений наименьшего элемента разрешения по частоте подполосы z может составлять от 8 кГц до 14 кГц. Диапазон значений полосы подполосы z может составлять от 1,6 кГц до 8 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы z может составлять от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц или от 12 кГц до 14 кГц. Конечно, диапазон элемента разрешения по частоте подполосы z не ограничивается вышеприведенными примерами.

[0204] Например, диапазон элемента разрешения по частоте подполосы w может определяться согласно фактическим потребностям. Например, диапазон значений наибольшего элемента разрешения по частоте подполосы w может составлять от 12 кГц до 16 кГц, и диапазон значений наименьшего элемента разрешения по частоте подполосы w может составлять от 8 кГц до 14 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы w составляет от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц, от 12 кГц до 14 кГц или от 12,2 кГц до 14,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы w не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы w может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы z.

[0205] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы i не ограничивается вышеприведенными примерами.

[0206] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы j не ограничивается вышеприведенными примерами.

[0207] Например, диапазон элемента разрешения по частоте подполосы m может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы m не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы m может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы i.

[0208] Например, диапазон элемента разрешения по частоте подполосы n может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы n не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы n может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы j.

[0209] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2 кГц до 3,2 кГц или от 2,5 кГц до 3,4 кГц. Конечно, диапазон элемента разрешения по частоте подполосы x не ограничивается вышеприведенными примерами.

[0210] Например, диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,4 кГц до 6,4 кГц или от 4,5 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы y не ограничивается вышеприведенными примерами.

[0211] Например, диапазон элемента разрешения по частоте подполосы p может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,1 кГц до 3,2 кГц или от 2,5 кГц до 3,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы p не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы p может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0212] Например, диапазон элемента разрешения по частоте подполосы q может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,2 кГц до 6,4 кГц или от 4,7 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы q не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы q может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0213] Например, диапазон элемента разрешения по частоте подполосы r может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,05 кГц до 3,27 кГц или от 2,59 кГц до 3,51 кГц. Конечно, диапазон элемента разрешения по частоте подполосы r не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы r может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0214] Например, диапазон элемента разрешения по частоте подполосы s может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,4 кГц до 7,1 кГц или от 4,55 кГц до 6,29 кГц. Конечно, диапазон элемента разрешения по частоте подполосы s не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы s может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0215] Например, диапазон элемента разрешения по частоте подполосы e может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 0,8 кГц до 3 кГц или от 1,9 кГц до 3,8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы e не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы e может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0216] Например, диапазон элемента разрешения по частоте подполосы f может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,3 кГц до 7,15 кГц или от 4,58 кГц до 6,52 кГц. Конечно, диапазон элемента разрешения по частоте подполосы f не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы f может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0217] Первое условие параметра и второе условие параметра может изменяться.

[0218] Например, в некоторых возможных вариантах реализации настоящего изобретения, первое условие параметра в этом варианте осуществления может быть, например, первым условием параметра согласно варианту осуществления способа, и второе условие параметра в этом варианте осуществления может быть, например, вторым условием параметра согласно варианту осуществления способа. За соответствующими описаниями, обратимся к записям согласно варианту осуществления способа.

[0219] Очевидно, что функции каждого функционального модуля аудиокодера 900 в этом варианте осуществления, в частности, могут быть реализованы согласно способам вышеприведенных вариантов осуществления способа. За конкретным процессом реализации, обратимся к соответствующему описанию вышеприведенных вариантов осуществления способа, и детали здесь не описаны.

[0220] Аудиокодер 900 может представлять собой любое устройство, которое необходимо для сбора, сохранения или передачи аудиосигнала, например, мобильный телефон, планшетный компьютер, персональный компьютер или компьютер-ноутбук.

[0221] Как можно видеть, в решениях этого варианта осуществления, после получения опорного параметра кодирования текущего кадра аудио, аудиокодер 900 выбирает алгоритм TCX или алгоритм HQ на основании полученного опорного параметра кодирования текущего кадра аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Опорный параметр кодирования текущего кадра аудио связан с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0222] На фиг. 10 показана структурная блок-схема аудиокодера 1000 согласно другому варианту осуществления настоящего изобретения.

[0223] Аудиокодер 1000 может включать в себя, по меньшей мере, один процессор 1001, память 1005 и, по меньшей мере, одну шину 1002 связи. Шина 1002 связи выполнена с возможностью реализации соединения и связи между компонентами.

[0224] В необязательном порядке, аудиокодер 1000 может дополнительно включать в себя, по меньшей мере, один сетевой интерфейс 1004, пользовательский интерфейс 1003 и пр. В необязательном порядке, пользовательский интерфейс 1003 включает в себя дисплей (например, сенсорный экран, жидкокристаллический дисплей, устройство формирования голографического (по-английски: Holographic) изображения или проектор (по-английски: Projector)), указательное устройство (например, мышь, шаровой манипулятор (по-английски: trackball), сенсорную панель или сенсорный экран), камеру и/или считывающее устройство.

[0225] Память 1005 может включать в себя постоянную память и оперативную память и обеспечивать инструкцию и данные для процессора 1001. Часть памяти 1005 может дополнительно включать в себя энергонезависимую оперативную память.

[0226] В некоторых вариантах реализации, в памяти 1005 хранятся следующие элементы, исполнимые модули или структуры данных, или их подмножество, или их расширяющее множество: блок 910 временно-частотного преобразования, блок 920 получения и блок 930 кодирования.

[0227] В этом варианте осуществления настоящего изобретения, процессор 1001 выполняет код или инструкцию в памяти 1005, чтобы: осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио; получать опорный параметр кодирования текущего кадра аудио; и если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.

[0228] Согласно требованию сценария применения, опорный параметр кодирования, полученный процессором 1001 и относящийся к текущему кадру аудио, может изменяться.

[0229] Например, опорный параметр кодирования может включать в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио.

[0230] Большее значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио указывает более сильную спектральную корреляцию между спектральными коэффициентами, расположенными в подполосе p, и спектральными коэффициентами, расположенными в подполосе q. Значение параметра спектральной корреляции может быть, например, значением параметра нормализованной кросс-корреляции.

[0231] Диапазоны элемента разрешения по частоте подполос могут определяться согласно фактическим потребностям.

[0232] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы z может быть больше критического элемента F1 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы w может быть больше критического элемента F1 разрешения по частоте. Диапазон значений критического элемента F1 разрешения по частоте может составлять, например, от 6,4 кГц до 12 кГц. Например, значение критического элемента F1 разрешения по частоте может быть равно 6,4 кГц, 8 кГц, 9 кГц, 10 кГц или 12 кГц. Конечно, критический элемент F1 разрешения по частоте может иметь другое значение.

[0233] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы j может быть больше критического элемента F2 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте. Например, диапазон значений критического элемента F2 разрешения по частоте может составлять от 4,8 кГц до 8 кГц. В частности, например, значение критического элемента F2 разрешения по частоте может быть равно 6,4 кГц, 4,8 кГц, 6 кГц, 8 кГц, 5 кГц или 7 кГц. Конечно, критический элемент F2 разрешения по частоте может иметь другое значение.

[0234] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы i может быть меньше наибольшего элемента разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m может быть меньше наибольшего элемента разрешения по частоте подполосы n, наибольший элемент разрешения по частоте подполосы x может быть меньше или равен наименьшему элементу разрешения по частоте подполосы y, наибольший элемент разрешения по частоте подполосы p может быть меньше или равен наименьшему элементу разрешения по частоте подполосы q, наибольший элемент разрешения по частоте подполосы r может быть меньше или равен наименьшему элементу разрешения по частоте подполосы s, и наибольший элемент разрешения по частоте подполосы e может быть меньше или равен наименьшему элементу разрешения по частоте подполосы f.

[0235] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий:

наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы m меньше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте.

[0236] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий:

наибольший элемент разрешения по частоте подполосы e меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы x меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы p меньше или равен критическому элементу F2 разрешения по частоте, или наибольший элемент разрешения по частоте подполосы r меньше или равен критическому элементу F2 разрешения по частоте.

[0237] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы f может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы f может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы q может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы q может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы s может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы s может быть больше или равен критическому элементу F2 разрешения по частоте.

[0238] Например, диапазон значений наибольшего элемента разрешения по частоте подполосы z может составлять от 12 кГц до 16 кГц. Диапазон значений наименьшего элемента разрешения по частоте подполосы z может составлять от 8 кГц до 14 кГц. Диапазон значений полосы подполосы z может составлять от 1,6 кГц до 8 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы z может составлять от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц или от 12 кГц до 14 кГц. Конечно, диапазон элемента разрешения по частоте подполосы z не ограничивается вышеприведенными примерами.

[0239] Например, диапазон элемента разрешения по частоте подполосы w может определяться согласно фактическим потребностям. Например, диапазон значений наибольшего элемента разрешения по частоте подполосы w может составлять от 12 кГц до 16 кГц, и диапазон значений наименьшего элемента разрешения по частоте подполосы w может составлять от 8 кГц до 14 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы w составляет от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц, от 12 кГц до 14 кГц или от 12,2 кГц до 14,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы w не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы w может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы z.

[0240] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы i не ограничивается вышеприведенными примерами.

[0241] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы j не ограничивается вышеприведенными примерами.

[0242] Например, диапазон элемента разрешения по частоте подполосы m может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы m не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы m может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы i.

[0243] Например, диапазон элемента разрешения по частоте подполосы n может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы n не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы n может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы j.

[0244] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2 кГц до 3,2 кГц или от 2,5 кГц до 3,4 кГц. Конечно, диапазон элемента разрешения по частоте подполосы x не ограничивается вышеприведенными примерами.

[0245] Например, диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,4 кГц до 6,4 кГц или от 4,5 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы y не ограничивается вышеприведенными примерами.

[0246] Например, диапазон элемента разрешения по частоте подполосы p может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,1 кГц до 3,2 кГц или от 2,5 кГц до 3,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы p не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы p может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0247] Например, диапазон элемента разрешения по частоте подполосы q может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,2 кГц до 6,4 кГц или от 4,7 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы q не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы q может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0248] Например, диапазон элемента разрешения по частоте подполосы r может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,05 кГц до 3,27 кГц или от 2,59 кГц до 3,51 кГц. Конечно, диапазон элемента разрешения по частоте подполосы r не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы r может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0249] Например, диапазон элемента разрешения по частоте подполосы s может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,4 кГц до 7,1 кГц или от 4,55 кГц до 6,29 кГц. Конечно, диапазон элемента разрешения по частоте подполосы s не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы s может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0250] Например, диапазон элемента разрешения по частоте подполосы e может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 0,8 кГц до 3 кГц или от 1,9 кГц до 3,8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы e не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы e может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0251] Например, диапазон элемента разрешения по частоте подполосы f может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,3 кГц до 7,15 кГц или от 4,58 кГц до 6,52 кГц. Конечно, диапазон элемента разрешения по частоте подполосы f не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы f может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0252] Первое условие параметра и второе условие параметра может изменяться.

[0253] Например, в некоторых возможных вариантах реализации настоящего изобретения, первое условие параметра в этом варианте осуществления может быть, например, первым условием параметра согласно варианту осуществления способа, и второе условие параметра в этом варианте осуществления может быть, например, вторым условием параметра согласно варианту осуществления способа. За соответствующими описаниями, обратимся к записям согласно варианту осуществления способа.

[0254] Очевидно, что функции каждого функционального модуля аудиокодера 1000 в этом варианте осуществления, в частности, могут быть реализованы согласно способам вышеприведенных вариантов осуществления способа. За конкретным процессом реализации, обратимся к соответствующему описанию вышеприведенных вариантов осуществления способа, и детали здесь не описаны.

[0255] Аудиокодер 1000 может представлять собой любое устройство, которое необходимо для сбора, сохранения или передачи аудиосигнала, например, мобильный телефон, планшетный компьютер, персональный компьютер или компьютер-ноутбук.

[0256] Как можно видеть, в решениях этого варианта осуществления, после получения опорного параметра кодирования текущего кадра аудио, аудиокодер 1000 выбирает алгоритм TCX или алгоритм HQ на основании полученного опорного параметра кодирования текущего кадра аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Опорный параметр кодирования текущего кадра аудио связан с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0257] Дополнительно, используется несколько необязательных опорных параметров кодирования, что позволяет удовлетворять требованиям выбора алгоритма в нескольких сценариях.

[0258] Вариант осуществления настоящего изобретения дополнительно предусматривает компьютерный носитель данных, причем на компьютерном носителе данных может храниться программа, и когда программа выполняется, осуществляются некоторые или все этапы способа аудиокодирования, записанные согласно варианту осуществления способа.

[0259] Следует отметить, что, для краткого описания, вышеприведенные варианты осуществления способа представлены в виде нескольких действий. Однако специалистам в данной области техники очевидно, что настоящее изобретение не ограничивается описанным порядком действий, поскольку, согласно настоящему изобретению, некоторые этапы могут осуществляться в других порядках или одновременно. Специалисту в данной области техники также очевидно, что все варианты осуществления, описанные в этом описании изобретения принадлежат иллюстративным вариантам осуществления, и предусмотренные действия и модули не обязательно требуются согласно настоящему изобретению.

[0260] Согласно вышеприведенным вариантам осуществления, описание каждого варианта осуществления сосредоточены на соответствующих аспектах. За частью, которая не описана подробно согласно варианту осуществления, можно обратиться к соответствующим описаниям в других вариантах осуществления.

[0261] В некоторых вариантах осуществления, представленных в настоящей заявке, следует понимать, что раскрытое устройство можно реализовать иначе. Например, описанный вариант осуществления устройства является лишь иллюстративным. Например, разделение на блоки является лишь разделение на логические функции, и в фактической реализации может существовать другое разделение. Например, несколько блоков или компонентов может быть объединено или интегрировано в другую систему, или некоторые признаки можно игнорировать или не осуществлять. Кроме того, отображаемые или рассматриваемые взаимные соединения или прямые соединения или коммуникационные соединения можно реализовать через некоторые интерфейсы. Непрямые соединения или коммуникационные соединения между устройствами иди блоками могут быть реализованы электрическими, механическими или другими средствами.

[0262] Блоки, описанные как отдельные части могут быть или не быть физически отдельными, и части, отображаемые как блоки, могут быть или не быть физическими блоками, могут располагаться в одном положении, или могут распределяться по множеству сетевых блоков. Некоторые или все из блоков могут выбираться согласно фактическим потребностям для решения задач вариантов осуществления.

[0263] Кроме того, функциональные блоки согласно вариантам осуществления настоящего изобретения могут интегрироваться в один блок обработки, или каждый из блоков может существовать физически отдельно, или два или более блоков интегрированы в один блок. Объединенный блок можно реализовать в форме оборудования или можно реализовать в форме программного функционального блока.

[0264] Когда объединенный блок реализован в форме программного функционального блока и продается или используется как независимый продукт, объединенный блок может храниться на компьютерно-считываемом носителе данных. На основании такого понимания, технические решения настоящего изобретения, по существу, или часть, вносящая вклад в уровень техники, или все или часть технических решений можно реализовать в форме программного продукта. Программный продукт хранится на носителе данных и включает в себя несколько инструкций для предписания компьютерному устройству (которым может быть персональный компьютер, сервер или сетевое устройство) для осуществления всех или некоторых из этапов способов, описанных согласно вариантам осуществления настоящего изобретения. Вышеупомянутый носитель данных включает в себя: любой носитель, где может храниться программный код, например, флэш-носитель с интерфейсом USB, сменный жесткий диск, постоянную память (ROM, Read-Only Memory), оперативную память (RAM, Random Access Memory), магнитный диск или оптический диск.

[0265] Вышеприведенные варианты осуществления предназначены лишь для описания технических решений настоящего изобретения, но не для ограничения настоящего изобретения. Хотя настоящее изобретение подробно описано согласно вышеприведенным вариантам осуществления, специалисты в данной области техники должны понимать, что они могут вносить изменения в технические решения, описанные согласно вышеприведенным вариантам осуществления или делать эквивалентные замены в некоторых их технических особенностях, не выходя за рамки объема технических решений вариантов осуществления настоящего изобретения.

ПЕРЕВОД ЧЕРТЕЖЕЙ

фиг. 1

101. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

102. получать опорный параметр кодирования текущего кадра аудио

103. если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

104. если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 2

201. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

202. Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио

203. Больше или равно ли частное средних по энергии порогу T4

204. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

205. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 3

301. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

302. Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио

303. определять, больше или равно ли частное средних по энергии порогу T68

304. Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио

305. больше ли отношение пикового значения к среднему, чем порог T69

306. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

307. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 4

401. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

402. Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио

403. попадает ли отношение между отношениями пикового значения к среднему в интервал R1

404. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

405. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 5

501. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

502. Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио

503. больше или равно ли частное отношений пикового значения к среднему порогу T46

504. больше или равно ли отношение пикового значения к среднему спектральных коэффициентов, расположенных в подполосе y, порогу T47

505. меньше ли отношение пикового значения к среднему спектральных коэффициентов, расположенных в подполосе y, чем порог T47

506. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

507. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 6

601. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

602. Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио

603. попадает ли отношение отношений пикового значения к среднему в интервал R1

604. Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио

605. больше или равно ли частное средних по энергии порогу T16

606. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

607. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 7

701. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

702. больше или равна ли скорость кодирования текущего кадра аудио порогу T1

703. Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио

704. больше или равно ли частное средних по энергии порогу T12

705. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

706. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 8

801. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

802. Получать среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио и среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио

803. больше или равно ли частное средних по амплитуде порогу T6

804. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

805. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 9

900. Аудиокодер

910. блок временно-частотного преобразования

920. Блок получения

930. Блок кодирования

фиг. 10

1000. Аудиокодер

1001. Процессор

1003. Пользовательский интерфейс

1004. Сетевой интерфейс

1005. Память

1. Способ аудиокодирования, содержащий этапы, на которых:

осуществляют обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;

получают один или более опорных параметров кодирования текущего кадра аудио; и

если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет любому одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием; или

если полученный опорный параметр кодирования текущего кадра аудио не удовлетворяет ни одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества;

причем текущий кадр содержит подполосу z, подполосу i и подполосу j, при этом подполосы z, i и j являются такими, что:

наибольший элемент разрешения по частоте подполосы z больше, чем критический элемент F1 разрешения по частоте, диапазон значений критического элемента F1 разрешения по частоте составляет от 6,4 кГц до 12 кГц;

наибольший элемент разрешения по частоте подполосы i меньше, чем наибольший элемент разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте, и диапазон значений критического элемента F2 разрешения по частоте составляет от 4,8 кГц до 8 кГц;

при этом опорные параметры кодирования содержат:

пиковое значение спектральных коэффициентов, расположенных в пределах подполосы z, и среднее значение спектральных коэффициентов, расположенных в пределах подполосы z; и

среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы i, и среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы j; и

при этом условия параметра содержат следующее условие параметра:

пиковое значение спектральных коэффициентов, расположенных в пределах подполосы z, больше, чем среднее значение спектральных коэффициентов, расположенных в пределах подполосы z, умноженное на порог Т2; и

средняя энергия спектральных коэффициентов, расположенных в пределах подполосы j, больше, чем произведение средней энергии спектральных коэффициентов, расположенных в пределах подполосы i, умноженной на порог Т4.

2. Способ по п. 1, в котором наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j или наименьший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте.

3. Способ по п. 1 или 2, в котором порог Т2 является не меньше чем 1, или порог Т2 является не меньше чем 2, или порог Т2 является не меньше чем 3, или порог Т2 является не меньше чем 5; и

при этом порог Т4 является не меньше чем 0,5, или порог Т4 является не меньше чем 1, или порог Т4 является не меньше чем 2, или порог Т4 является не меньше чем 3.

4. Способ по п. 1 или 2, в котором диапазон элементов разрешения по частоте подполосы z от 8 кГц до 12 кГц, или от 9 кГц до 11 кГц, или от 8 кГц до 9,6 кГц, или от 12 кГц до 14 кГц;

при этом диапазон элементов разрешения по частоте подполосы i от 3,2 кГц до 6,4 кГц, или от 3,2 кГц до 4,8 кГц, или от 4,8 кГц до 6,4 кГц, или от 0,4 кГц до 6,4 кГц, или от 0,4 кГц до 3,6 кГц; и

при этом диапазон элементов разрешения по частоте подполосы j от 6,4 кГц до 9,6 кГц, или от 6,4 кГц до 8 кГц, или от 8 кГц до 9,6 кГц, или от 4,8 кГц до 9,6 кГц, или от 4,8 кГц до 8 кГц.

5. Способ аудиокодирования, содержащий этапы, на которых:

осуществляют обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;

получают один или более опорных параметров кодирования текущего кадра аудио; и

если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет любому одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием; или

если полученный опорный параметр кодирования текущего кадра аудио не удовлетворяет ни одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества;

причем текущий кадр содержит подполосу i и подполосу j;

при этом наибольший элемент разрешения по частоте подполосы i меньше, чем наибольший элемент разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы j больше критического элемента F2 разрешения по частоте, и F2 находится в диапазоне от 4,8 кГц до 8 кГц;

причем опорные параметры кодирования содержат:

среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы i, и среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы j;

и при этом условия параметра содержат следующее условие параметра:

средняя энергия спектральных коэффициентов, размещенных в пределах подполосы j больше, чем произведение средней энергии спектральных коэффициентов, расположенных в пределах подполосы i, умноженной на порог Т4.

6. Способ по п. 5, в котором наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j или наименьший элемент разрешения по частоте подполосы j больше критического элемента разрешения по частоте F2.

7. Способ по п. 5 или 6, в котором порог Т4 является не меньше чем 0,5, или порог Т4 является не меньше чем 1, или порог Т4 является не меньше чем 2, или порог Т4 является не меньше чем 3.

8. Способ по п. 5 или 6, в котором диапазон элементов разрешения по частоте подполосы i от 3,2 кГц до 6,4 кГц, или от 3,2 кГц до 4,8 кГц, или от 4,8 кГц до 6,4 кГц, или от 0,4 кГц до 6,4 кГц, или от 0,4 кГц до 3,6 кГц; и

диапазон элементов разрешения по частоте подполосы j от 6,4 кГц до 9,6 кГц, или от 6,4 кГц до 8 кГц, или от 8 кГц до 9,6 кГц, или от 4,8 кГц до 9,6 кГц, или от 4,8 кГц до 8 кГц.

9. Способ аудиокодирования, содержащий этапы, на которых:

осуществляют обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;

получают один или более опорных параметров кодирования текущего кадра аудио; и

если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет любому одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием; или

если полученный опорный параметр кодирования текущего кадра аудио не удовлетворяет ни одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества;

причем текущий кадр содержит подполосу x и подполосу y;

при этом наибольший элемент разрешения по частоте подполосы x меньше или равен наименьшему элементу разрешения по частоте подполосы y;

причем опорные параметры кодирования содержат:

пиковое значение спектральных коэффициентов, расположенных в пределах подполосы x, и среднее значение спектральных коэффициентов, расположенных в пределах подполосы x; пиковое значение спектральных коэффициентов, расположенных в пределах подполосы y, и среднее значение спектральных коэффициентов, расположенных в пределах подполосы y; и

при этом условия параметра содержат следующее условие параметра:

произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы x, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы y, меньше, чем произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы y, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы x и умноженного на наименьшее значение интервала R1; или

произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы x, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы y, больше, чем произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы y, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы x, и умноженного на наибольшее значение интервала R1.

10. Способ по п. 9, в котором интервал R1 составляет [0,5, 2], или интервал R1 составляет [0,4, 2,5], или интервал R1 составляет [0,8, 1,25].

11. Способ по п. 9 или 10, в котором диапазон элементов разрешения по частоте подполосы x от 1 кГц до 2,6 кГц и диапазон элементов разрешения по частоте подполосы y от 4,8 кГц до 6,4 кГц.

12. Аудиокодер, содержащий:

блок временно-частотного преобразования, выполненный с возможностью осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;

блок получения, выполненный с возможностью получения одного или более опорных параметров кодирования текущего кадра аудио; и

блок кодирования, выполненный с возможностью: если опорные параметры кодирования текущего кадра аудио удовлетворяют любому одному из набора условий параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием, или если опорные параметры кодирования текущего кадра аудио не удовлетворяют ни одному из условий параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества;

причем текущий кадр содержит подполосу z, подполосу i и подполосу j, при этом подполосы z, i и j являются такими, что:

наибольший элемент разрешения по частоте подполосы z больше, чем критический элемент F1 разрешения по частоте, диапазон значений критического элемента F1 разрешения по частоте составляет от 6,4 кГц до 12 кГц;

наибольший элемент разрешения по частоте подполосы i меньше, чем наибольший элемент разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте, и диапазон значений критического элемента F2 разрешения по частоте составляет от 4,8 кГц до 8 кГц; и

при этом опорные параметры кодирования содержат:

пиковое значение спектральных коэффициентов, расположенных в пределах подполосы z, и среднее значение спектральных коэффициентов, расположенных в пределах подполосы z; и

среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы i, и среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы j; и

при этом условия параметра содержат следующее условие параметра:

пиковое значение спектральных коэффициентов, расположенных в пределах подполосы z, больше, чем среднее значение спектральных коэффициентов, расположенных в пределах подполосы z, умноженное на порог Т2; и

средняя энергия спектральных коэффициентов, расположенных в пределах подполосы j, больше, чем произведение средней энергии спектральных коэффициентов, расположенных в пределах подполосы i, умноженной на порог Т4.

13. Аудиокодер по п. 12, в котором наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j или наименьший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте.

14. Аудиокодер по п. 12 или 13, в котором порог Т2 является не меньше чем 1, или порог Т2 является не меньше чем 2, или порог Т2 является не меньше чем 3, или порог Т2 является не меньше чем 5; и

при этом порог Т4 является не меньше чем 0,5, или порог Т4 является не меньше чем 1, или порог Т4 является не меньше чем 2, или порог Т4 является не меньше чем 3.

15. Аудиокодер по п. 12 или 13, в котором диапазон элементов разрешения по частоте подполосы z от 8 кГц до 12 кГц, или от 9 кГц до 11 кГц, или от 8 кГц до 9,6 кГц, или от 12 кГц до 14 кГц;

при этом диапазон элементов разрешения по частоте подполосы i от 3,2 кГц до 6,4 кГц, или от 3,2 кГц до 4,8 кГц, или от 4,8 кГц до 6,4 кГц, или от 0,4 кГц до 6,4 кГц, или от 0,4 кГц до 3,6 кГц; и

при этом диапазон элементов разрешения по частоте подполосы j от 6,4 кГц до 9,6 кГц, или от 6,4 кГц до 8 кГц, или от 8 кГц до 9,6 кГц, или от 4,8 кГц до 9,6 кГц, или от 4,8 кГц до 8 кГц.

16. Аудиокодер, содержащий:

блок временно-частотного преобразования, выполненный с возможностью осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;

блок получения, выполненный с возможностью получения одного или более опорных параметров кодирования текущего кадра аудио; и

блок кодирования, выполненный с возможностью: если опорные параметры кодирования текущего кадра аудио удовлетворяют любому одному из набора условий параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием, или если опорные параметры кодирования текущего кадра аудио не удовлетворяют ни одному из условий параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества;

причем текущий кадр содержит подполосу i и подполосу j;

при этом наибольший элемент разрешения по частоте подполосы i меньше, чем наибольший элемент разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы j больше критического элемента F2 разрешения по частоте, и F2 находится в диапазоне от 4,8 кГц до 8 кГц;

причем опорные параметры кодирования содержат:

среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы i, и среднюю энергию спектральных коэффициентов, расположенных в пределах подполосы j;

и при этом условия параметра содержат следующее условие параметра:

средняя энергия спектральных коэффициентов, размещенных в пределах подполосы j больше, чем произведение средней энергии спектральных коэффициентов, расположенных в пределах подполосы i, умноженной на порог Т4.

17. Аудиокодер по п. 16, в котором наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j или наименьший элемент разрешения по частоте подполосы j больше критического элемента разрешения по частоте F2.

18. Аудиокодер по п. 16 или 17, в котором порог Т4 является не меньше чем 0,5, или порог Т4 является не меньше чем 1, или порог Т4 является не меньше чем 2, или порог Т4 является не меньше чем 3.

19. Аудиокодер по п. 16 или 17, в котором диапазон элементов разрешения по частоте подполосы i от 3,2 кГц до 6,4 кГц, или от 3,2 кГц до 4,8 кГц, или от 4,8 кГц до 6,4 кГц, или от 0,4 кГц до 6,4 кГц, или от 0,4 кГц до 3,6 кГц; и

диапазон элементов разрешения по частоте подполосы j от 6,4 кГц до 9,6 кГц, или от 6,4 кГц до 8 кГц, или от 8 кГц до 9,6 кГц, или от 4,8 кГц до 9,6 кГц, или от 4,8 кГц до 8 кГц.

20. Аудиокодер, содержащий:

блок временно-частотного преобразования, выполненный с возможностью осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;

блок получения, выполненный с возможностью получения одного или более опорных параметров кодирования текущего кадра аудио; и

блок кодирования, выполненный с возможностью: если опорные параметры кодирования текущего кадра аудио удовлетворяют любому одному из набора условий параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием, или если опорные параметры кодирования текущего кадра аудио не удовлетворяют ни одному из условий параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества;

причем текущий кадр содержит подполосу x и подполосу y;

при этом наибольший элемент разрешения по частоте подполосы x меньше или равен наименьшему элементу разрешения по частоте подполосы y;

причем опорные параметры кодирования содержат:

пиковое значение спектральных коэффициентов, расположенных в пределах подполосы x, и среднее значение спектральных коэффициентов, расположенных в пределах подполосы x; пиковое значение спектральных коэффициентов, расположенных в пределах подполосы y, и среднее значение спектральных коэффициентов, расположенных в пределах подполосы y; и

при этом условия параметра содержат следующее условие параметра:

произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы x, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы y, меньше, чем произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы y, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы x, и умноженного на наименьшее значение интервала R1; или

произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы x, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы y, больше, чем произведение пикового значения спектральных коэффициентов, расположенных в пределах подполосы y, умноженного на среднее значение коэффициентов, расположенных в пределах подполосы x, и умноженного на наибольшее значение интервала R1.

21. Аудиокодер по п. 20, в котором интервал R1 составляет [0,5, 2], или интервал R1 составляет [0,4, 2,5], или интервал R1 составляет [0,8, 1,25].

22. Аудиокодер по п. 20 или 21, в котором диапазон элементов разрешения по частоте подполосы x от 1 кГц до 2,6 кГц и диапазон элементов разрешения по частоте подполосы y от 4,8 кГц до 6,4 кГц.



 

Похожие патенты:

Изобретение относится к средствам для переключения технологии кодирования при кодировании аудиосигнала. Технический результат заключается в сокращении артефактов на границах кадров и несогласованностей энергии при переключении технологии кодирования.

Изобретение относится к области обработки аудиосигналов. Технический результат заключается в повышении эффективности обработки аудиосигналов.

Изобретение относится к области обработки сигналов. Технический результат заключается в повышении качества генерируемого комфортного шума кадров тишины.

Изобретение относится к средствам для определения режима кодирования и для кодирования/декодирования аудиосигналов. Технический результат заключается в сокращении задержек, вызванных частым изменением режима кодирования.

Изобретение относится к области обработки цифровых сигналов. Технический результат – обеспечение коррекции потери кадров посредством использования спектральных компонент на последних достоверных кадрах.

Изобретение относится к средствам для кодирования аудио. Технический результат заключается в повышении качества кодирования аудио.

Изобретение относится к кодированию аудиосигнала. Технический результат изобретения заключается в возможности поддерживать качество речи при уменьшении скорости передачи битов.

Изобретение относится к средствам для кодирования и декодирования аудиосигнала. Технический результат заключается в повышении качества кодируемого звука при низких скоростях передачи битов.

Изобретение относится к области кодирования и передачи аудиосигналов. Технический результат заключается в повышении точности кодирования аудиосигнала.

Изобретение относится к области обнаружения речевой активности (VAD). Техническим результатом является уменьшение риска отсечения середины и окончания речевых пакетов путем добавления хвостов сигнала.

Изобретение относится к области аудиокодирования. Технический результат заключается в повышении эффективности аудиокодирования.

Изобретение относится к средствам для аналого-цифрового преобразования аудио. Технический результат заключается в повышении эффективности аналого-цифрового преобразования аудио.

Изобретение относится к средствам для кодирования и декодирования аудиосигнала. Технический результат заключается в повышении эффективности кодирования.

Изобретение относится к средствам кодирования и декодирования аудиосигнала. Технический результат заключается в повышении качества кодированного аудиосигнала.

Изобретение относится к кодированию и декодированию аудиосигнала. Технический результат – обеспечение усовершенствованого принципа аудиокодирования.

Изобретение относится к средствам для кодирования, декодирования и вывода аудиосигнала. Технический результат заключается в повышении качества аудиосигнала.

Изобретение относится к средствам для сжатия и распаковки представления на основе амбиофонии высшего порядка. Технический результат заключается в повышении эффективности сжатия.

Изобретение относится к средствам для сжатия разложенных представлений звукового поля. Технический результат заключается в повышении эффективности обработки звукового поля.

Изобретение относится к области аудиокодирования. Технический результат заключается в повышении эффективности аудиокодирования.
Наверх