Способ и устройство кодирования аудио

Изобретение относится к области технологий обработки сигналов и предназначено для кодирования аудиосигналов. Технический результат – уменьшение сложности кодирования и повышение точности кодирования. Способ включает в себя: определение разреженности распределения, по спектрам, энергии N входных аудиокадров, где N аудиокадров включают в себя текущий аудиокадр и N представляет собой положительное целое число; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый или второй способ кодирования для кодирования текущего аудиокадра, где первый способ кодирования представляет собой способ кодирования, который основывается на частотно-временном преобразовании и квантовании коэффициентов преобразования и который не основывается на линейном предсказании, и второй способ кодирования представляет собой способ кодирования на основе линейного предсказания. 2 н. и 28 з.п. ф-лы, 3 ил.

 

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

[0001] Варианты осуществления настоящего изобретения относятся к области технологий обработки сигналов и, более конкретно, к способу и устройству кодирования аудио.

УРОВЕНЬ ТЕХНИКИ

[0002] В известном уровне техники обычно используется гибридный кодер для кодирования аудиосигнала в системах передачи речи. Конкретно, гибридный кодер обычно включает в себя два подкодера. Один подкодер подходит для кодирования речевого сигнала, и другой кодер подходит для кодирования неречевого сигнала. Для принимаемого аудиосигнала каждый подкодер гибридного кодера кодирует аудиосигнал. Гибридный кодер непосредственно сравнивает качество кодированных аудиосигналов для выбора оптимального подкодера. Однако такой способ кодирования с обратной связью имеет высокую сложность эксплуатации.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0003] Варианты осуществления настоящего изобретения обеспечивают способ и устройство кодирования аудио, которые могут уменьшить сложность кодирования и гарантировать, что кодирование выполняется с относительно высокой точностью.

[0004] Согласно первому аспекту, обеспечивается способ кодирования аудио, в котором способ включает в себя: определение разреженности распределения, по спектрам, энергии N входных аудиокадров, где N аудиокадров включает в себя текущий аудиокадр, и N представляет собой положительное целое число; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, где первый способ кодирования представляет собой способ кодирования, который основывается на частотно-временном преобразовании и квантовании коэффициентов преобразования, и который не основывается на линейном предсказании, и второй способ кодирования представляет собой способ кодирования на основе линейного предсказания.

[0005] С ссылкой на первый аспект, в первом возможном методе реализации первого аспекта, определение разреженности распределения, по спектрам, энергии N входных аудиокадров включает в себя: деление спектра каждого из N аудиокадров на P огибающих спектра, где P представляет собой положительное целое число; и определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где параметр общей разреженности указывает разреженность распределения, по спектрам, энергии N аудиокадров.

[0006] С ссылкой на первый возможный метод реализации первого аспекта, во втором возможном методе реализации первого аспекта, параметр общей разреженности включает в себя первую минимальную ширину полосы; определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров представляет собой первую минимальную ширину полосы; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: когда первая минимальная ширина полосы меньше первого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда первая минимальная ширина полосы больше первого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра.

[0007] С ссылкой на второй возможный метод реализации первого аспекта, в третьем возможном методе реализации первого аспекта, определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: сортировку энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определение, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров; и определение, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров.

[0008] С ссылкой на первый возможный метод реализации первого аспекта, в четвертом возможном методе реализации первого аспекта, параметр общей разреженности включает в себя первую пропорцию энергии; определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: выбор P1 огибающих спектра из P огибающих спектра каждого из N аудиокадров; и определение первой пропорции энергии в соответствии с энергией P1 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, где P1 представляет собой положительное целое число меньше P; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: когда первая пропорция энергии больше второго заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда первая пропорция энергии меньше второго заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра.

[0009] С ссылкой на четвертый возможный метод реализации первого аспекта, в пятом возможном методе реализации первого аспекта, энергия любой одной из P1 огибающих спектра больше энергии любой одной из других огибающих спектра в P огибающих спектра, за исключением P1 огибающих спектра.

[0010] С ссылкой на первый возможный метод реализации первого аспекта, в шестом возможном методе реализации первого аспекта, параметр общей разреженности включает в себя вторую минимальную ширину полосы и третью минимальную ширину полосы; определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее значение минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров используется в качестве второй минимальной ширины полосы, среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров используется в качестве третьей минимальной ширины полосы, и вторая заранее заданная пропорция меньше третьей заранее заданной пропорции; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра включает в себя: когда вторая минимальная ширина полосы меньше третьего заранее заданного значения, и третья минимальная ширина полосы меньше четвертого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; когда третья минимальная ширина полосы меньше пятого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда третья минимальная ширина полосы больше шестого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра, где четвертое заранее заданное значение больше или равно третьему заранее заданному значению, пятое заранее заданное значение меньше четвертого заранее заданного значения, и шестое заранее заданное значение больше четвертого заранее заданного значения.

[0011] С ссылкой на шестой возможный метод реализации первого аспекта, в седьмом возможном методе реализации первого аспекта, определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: сортировку энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определение, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров; определение, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров; определение, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров; и определение, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров.

[0012] С ссылкой на первый возможный метод реализации первого аспекта, в восьмом возможном методе реализации первого аспекта, параметр общей разреженности включает в себя вторую пропорцию энергии и третью пропорцию энергии; определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: выбор P2 огибающих спектра из P огибающих спектра каждого из N аудиокадров; определение второй пропорции энергии в соответствии с энергией P2 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров; выбор P3 огибающих спектра из P огибающих спектра каждого из N аудиокадров; и определение третьей пропорции энергии в соответствии с энергией P3 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, где P2 и P3 представляют собой положительные целые числа меньше P, и P2 меньше P3; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: когда вторая пропорция энергии больше седьмого заранее заданного значения, и третья пропорция энергии больше восьмого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; когда вторая пропорция энергии больше девятого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда третья пропорция энергии меньше десятого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра.

[0013] С ссылкой на восьмой возможный метод реализации первого аспекта, в девятом возможном методе реализации первого аспекта, P2 огибающих спектра представляют собой P2 огибающих спектра, имеющих максимальную энергию в P огибающих спектра; и P3 огибающих спектра представляют собой P3 огибающих спектра, имеющих максимальную энергию в P огибающих спектра.

[0014] С ссылкой на первый аспект, в десятом возможном методе реализации первого аспекта, разреженность распределения энергии по спектрам включает в себя глобальную разреженность, локальную разреженность и кратковременный всплеск распределения энергии по спектрам.

[0015] С ссылкой на десятый возможный метод реализации первого аспекта, в одиннадцатом возможном методе реализации первого аспекта, N равно 1, и N аудиокадров представляют собой текущий аудиокадр; и определение разреженности распределения, по спектрам, энергии N входных аудиокадров включает в себя: деление спектра текущего аудиокадра на Q подполос; и определение параметра разреженности всплесков в соответствии с пиковой энергией каждой из Q подполос спектра текущего аудиокадра, где параметр разреженности всплесков используется для указания глобальной разреженности, локальной разреженности и кратковременного всплеска текущего аудиокадра.

[0016] С ссылкой на одиннадцатый возможный метод реализации первого аспекта, в двенадцатом возможном методе реализации первого аспекта, параметр разреженности всплесков включает в себя: глобальную пропорцию пиковой энергии к средней каждой из Q подполос, локальную пропорцию пиковой энергии к средней каждой из Q подполос и кратковременное отклонение энергии каждой из Q подполос, где глобальная пропорция пиковой энергии к средней определяется в соответствии с пиковой энергией в подполосе и средней энергией во всех подполосах текущего аудиокадра, локальная пропорция пиковой энергии к средней определяется в соответствии с пиковой энергией и подполосе и средней энергией в подполосе, и кратковременное отклонение пиковой энергии определяется в соответствии с пиковой энергией в подполосе и пиковой энергией в конкретной полосе частот аудиокадра перед этим аудиокадром; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: определение, имеется ли первая подполоса в Q подполосах, где локальная пропорция пиковой энергии к средней первой подполосы больше одиннадцатого заранее заданного значения, глобальная пропорция пиковой энергии к средней первой подполосы больше двенадцатого заранее заданного значения, и кратковременное отклонение пиковой энергии первой подполосы больше тринадцатого заранее заданного значения; и, когда имеется первая подполоса в Q подполосах, определение использования первого способа кодирования для кодирования текущего аудиокадра.

[0017] С ссылкой на первый аспект, в тринадцатом возможном методе реализации первого аспекта, разреженность распределения энергии по спектрам включает в себя ограниченные полосой характеристики распределения энергии по спектрам.

[0018] С ссылкой на тринадцатый возможный метод реализации первого аспекта, в четырнадцатом возможном методе реализации первого аспекта, определение разреженности распределения, по спектрам, энергии N входных аудиокадров включает в себя: определение разграничительной частоты каждого из N аудиокадров; и определение параметра ограниченной полосой разреженности в соответствии с разграничительной частотой каждого из N аудиокадров.

[0019] С ссылкой на четырнадцатый возможный метод реализации первого аспекта, в пятнадцатом возможном методе реализации первого аспекта, параметр ограниченной полосой разреженности представляет собой среднее значение разграничительных частот N аудиокадров; и определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: когда определяется, что параметр ограниченной полосой разреженности аудиокадров меньше четырнадцатого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра.

[0020] Согласно второму аспекту, вариант осуществления настоящего изобретения обеспечивает устройство, где устройство включает в себя: блок получения, выполненный с возможностью получения N аудиокадров, где N аудиокадров включает в себя текущий аудиокадр, и N представляет собой положительное целое число; и блок определения, выполненный с возможностью определения разреженности распределения, по спектрам, энергии N аудиокадров, полученных блоком получения; и блок определения дополнительно выполнен с возможностью определения, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, где первый способ кодирования представляет собой способ кодирования, который основывается на частотно-временном преобразовании и квантовании коэффициентов преобразования, и который не основывается на линейном предсказании, и второй способ кодирования представляет собой способ кодирования на основе линейного предсказания.

[0021] С ссылкой на второй аспект, в первом возможном методе реализации второго аспекта, блок определения конкретно выполнен с возможностью деления спектра каждого из N аудиокадров на P огибающих спектра, и определения параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где P представляет собой положительное целое число, и параметр общей разреженности указывает разреженность распределения, по спектрам, энергии N аудиокадров.

[0022] С ссылкой на первый возможный метод реализации второго аспекта, во втором возможном методе реализации второго аспекта, параметр общей разреженности включает в себя первую минимальную ширину полосы; блок определения конкретно выполнен с возможностью определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров представляет собой первую минимальную ширину полосы; и блок определения конкретно выполнен с возможностью: когда первая минимальная ширина полосы меньше первого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда первая минимальная ширина полосы больше первого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра.

[0023] С ссылкой на второй возможный метод реализации второго аспекта, в третьем возможном методе реализации второго аспекта, блок определения конкретно выполнен с возможностью: сортировки энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров; и определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров.

[0024] С ссылкой на первый возможный метод реализации второго аспекта, в четвертом возможном методе реализации второго аспекта, параметр общей разреженности включает в себя первую пропорцию энергии; блок определения конкретно выполнен с возможностью выбора P1 огибающих спектра из P огибающих спектра каждого из N аудиокадров, и определения первой пропорции энергии в соответствии с энергией P1 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, где P1 представляет собой положительное целое число меньше P; и блок определения конкретно выполнен с возможностью: когда первая пропорция энергии больше второго заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда первая пропорция энергии меньше второго заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра.

[0025] С ссылкой на четвертый возможный метод реализации второго аспекта, в пятом возможном методе реализации второго аспекта, блок определения конкретно выполнен с возможностью определения P1 огибающих спектра в соответствии с энергией P огибающих спектра, где энергия любой одной из P1 огибающих спектра больше энергии любой одной из других огибающих спектра в P огибающих спектра, за исключением P1 огибающих спектра.

[0026] С ссылкой на первый возможный метод реализации второго аспекта, в шестом возможном методе реализации второго аспекта, параметр общей разреженности включает в себя вторую минимальную ширину полосы и третью минимальную ширину полосы; блок определения конкретно выполнен с возможностью определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее значение минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров используется в качестве второй минимальной ширины полосы, среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров используется в качестве третьей минимальной ширины полосы, и вторая заранее заданная пропорция меньше третьей заранее заданной пропорции; и блок определения конкретно выполнен с возможностью: когда вторая минимальная ширина полосы меньше третьего заранее заданного значения, и третья минимальная ширина полосы меньше четвертого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; когда третья минимальная ширина полосы меньше пятого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда третья минимальная ширина полосы больше шестого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра, где четвертое заранее заданное значение больше или равно третьему заранее заданному значению, пятое заранее заданное значение меньше четвертого заранее заданного значения, и шестое заранее заданное значение больше четвертого заранее заданного значения.

[0027] С ссылкой на шестой возможный метод реализации второго аспекта, в седьмом возможном методе реализации второго аспекта, блок определения конкретно выполнен с возможностью: сортировки энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров; определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров; и определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров.

[0028] С ссылкой на первый возможный метод реализации второго аспекта, в восьмом возможном методе реализации второго аспекта, параметр общей разреженности включает в себя вторую пропорцию энергии и третью пропорцию энергии; блок определения конкретно выполнен с возможностью: выбора P2 огибающих спектра из P огибающих спектра каждого из N аудиокадров, определения второй пропорции энергии в соответствии с энергией P2 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, выбора P3 огибающих спектра из P огибающих спектра каждого из N аудиокадров, и определения третьей пропорции энергии в соответствии с энергией P3 огибающих спектра каждого из N аудиокадров и полной энергий соответствующих N аудиокадров, где P2 и P3 представляют собой положительные целые числа меньше P, и P2 меньше P3; и блок определения конкретно выполнен с возможностью: когда вторая пропорция энергии больше седьмого заранее заданного значения, и третья пропорция энергии больше восьмого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; когда вторая пропорция энергии больше девятого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда третья пропорция энергии меньше десятого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра.

[0029] С ссылкой на восьмой возможный метод реализации второго аспекта, в девятом возможном методе реализации второго аспекта, блок определения конкретно выполнен с возможностью определения, из P огибающих спектра каждого из N аудиокадров, P2 огибающих спектра, имеющих максимальную энергию, и определения, из P огибающих спектра каждого из N аудиокадров, P3 огибающих спектра, имеющих максимальную энергию.

[0030] С ссылкой на второй аспект, в десятом возможном методе реализации второго аспекта, N равно 1, и N аудиокадров представляют собой текущий аудиокадр; и блок определения конкретно выполнен с возможностью деления спектра текущего аудиокадра на Q подполос и определения параметра разреженности всплесков в соответствии с пиковой энергией каждой из Q подполос спектра текущего аудиокадра, где параметр разреженности всплесков используется для указания глобальной разреженности, локальной разреженности и кратковременного всплеска текущего аудиокадра.

[0031] С ссылкой на десятый возможный метод реализации второго аспекта, в одиннадцатом возможном методе реализации второго аспекта, блок определения конкретно выполнен с возможностью определения глобальной пропорции пиковой энергии к средней каждой из Q подполос, локальной пропорции пиковой энергии к средней каждой из Q подполос и кратковременного отклонения энергии каждой из Q подполос, где глобальная пропорция пиковой энергии к средней определяется блоком определения в соответствии с пиковой энергией в подполосе и средней энергией во всех подполосах текущего аудиокадра, локальная пропорция пиковой энергии к средней определяется блоком определения в соответствии с пиковой энергией в подполосе и средней энергией в подполосе, и кратковременное отклонение пиковой энергии определяется в соответствии с пиковой энергией в подполосе и пиковой энергией в конкретной полосе частот аудиокадра перед этим аудиокадром; и блок определения конкретно выполнен с возможностью: определения, имеется ли первая подполоса в Q подполосах, где локальная пропорция пиковой энергии к средней первой подполосы больше одиннадцатого заранее заданного значения, глобальная пропорция пиковой энергии к средней первой подполосы больше двенадцатого заранее заданного значения, и кратковременное отклонение пиковой энергии первой подполосы больше тринадцатого заранее заданного значения; и, когда имеется первая подполоса в Q подполосах, определения использования первого способа кодирования для кодирования текущего аудиокадра.

[0032] С ссылкой на второй аспект, в двенадцатом возможном методе реализации второго аспекта, блок определения конкретно выполнен с возможностью определения разграничительной частоты каждого из N аудиокадров; и блок определения конкретно выполнен с возможностью определения параметра ограниченной полосой разреженности в соответствии с разграничительной частотой каждого из N аудиокадров.

[0033] С ссылкой на двенадцатый возможный метод реализации второго аспекта, в тринадцатом возможном методе реализации второго аспекта, параметр ограниченной полосой разреженности представляет собой среднее значение разграничительных частот N аудиокадров; и блок определения конкретно выполнен с возможностью: когда определяется, что параметр ограниченной полосой разреженности аудиокадров меньше четырнадцатого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра.

[0034] Согласно вышеупомянутым техническим решениям, когда кодируется аудиокадр, учитывается разреженность распределения, по спектру, энергии аудиокадра, что может уменьшить сложность кодирования и гарантировать, что кодирование выполняется с относительно высокой точностью.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0035] Чтобы более ясно описать технические решения в вариантах осуществления настоящего изобретения, нижеследующее кратко описывает прилагаемые чертежи, требуемые для описания вариантов осуществления настоящего изобретения. Очевидно, что прилагаемые чертежи в нижеследующем описании изображают просто некоторые варианты осуществления настоящего изобретения, и специалист в данной области техники может получить еще другие чертежи из этих прилагаемых чертежей без творческих усилий.

[0036] Фиг.1 представляет собой схематическую блок-схему последовательности операций способа кодирования аудио согласно варианту осуществления настоящего изобретения;

[0037] фиг.2 представляет собой конструктивную блок-схему устройства согласно варианту осуществления настоящего изобретения; и

[0038] фиг.3 представляет собой конструктивную блок-схему устройства согласно варианту осуществления настоящего изобретения.

ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

[0039] Нижеследующее ясно и полностью описывает технические решения в вариантах осуществления настоящего изобретения с ссылкой на прилагаемые чертежи в вариантах осуществления настоящего изобретения. Очевидно, что описанные варианты осуществления представляют собой просто часть, а не все варианты осуществления настоящего изобретения. Все другие варианты осуществления, получаемые специалистом в данной области техники, основываясь на вариантах осуществления настоящего изобретения без творческих усилий, должны подпадать под объем защиты настоящего изобретения.

[0040] Фиг.1 представляет собой схематическую блок-схему последовательности операций способа кодирования аудио согласно варианту осуществления настоящего изобретения.

[0041] 101: Определить разреженность распределения, по спектрам, энергии N входных аудиокадров, где N аудиокадров включают в себя текущий аудиокадр, и N представляет собой положительное целое число.

[0042] 102: Определить, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, где первый способ кодирования представляет собой способ кодирования, который основывается на частотно-временном преобразовании и квантовании коэффициентов преобразования, и который не основывается на линейном предсказании, и второй способ кодирования представляет собой способ кодирования на основе линейного предсказания.

[0043] Согласно способу, показанному на фиг.1, когда кодируется аудиокадр, учитывается разреженность распределения, по спектру, энергии аудиокадра, что может уменьшить сложность кодирования и гарантировать, что кодирование выполняется с относительно высокой точностью.

[0044] Во время выбора подходящего способа кодирования для аудиокадра, может учитываться разреженность распределения, по спектру, энергии аудиокадра. Может быть три типа разреженности распределения, по спектру, энергии аудиокадра: общая разреженность, разреженность всплесков и ограниченная полосой разреженность.

[0045] Необязательно, что в варианте осуществления, подходящий способ кодирования может выбираться для текущего аудиокадра посредством использования общей разреженности. В этом случае, определение разреженности распределения, по спектрам, энергии N входных аудиокадров включает в себя: деление спектра каждого из N аудиокадров на P огибающих спектра, где P представляет собой положительное целое число; и определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где параметр общей разреженности указывает разреженность распределения, по спектрам, энергии N аудиокадров.

[0046] Конкретно, среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с конкретной пропорцией N входных последовательных аудиокадров может определяться как общая разреженность. Меньшая ширина полосы указывает более сильную общую разреженность, и большая ширина полосы указывает более слабую общую разреженность. Другими словами, более сильная общая разреженность указывает, что энергия аудиокадра более централизована, и более слабая общая разреженность указывает, что энергия аудиокадра более рассредоточена. Эффективность является высокой, когда используется первый способ кодирования для кодирования аудиокадра, общая разреженность которого является относительно сильной. Поэтому, подходящий способ кодирования может выбираться посредством определения общей разреженности аудиокадра для кодирования аудиокадра. Чтобы способствовать определению общей разреженности аудиокадра, общая разреженность может квантоваться для получения параметра общей разреженности. Необязательно, что, когда N равно 1, общая разреженность представляет собой минимальную ширину полосы, распределенную по спектру, энергии с конкретной пропорцией текущего аудиокадра.

[0047] Необязательно, что в варианте осуществления параметр общей разреженности включает в себя первую минимальную ширину полосы. В этом случае, определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров представляет собой первую минимальную ширину полосы. Определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: когда первая минимальная ширина полосы меньше первого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда первая минимальная ширина полосы больше первого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра. Необязательно, что в варианте осуществления, когда N равно 1, N аудиокадров представляют собой текущий аудиокадр, и среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров представляет собой минимальную ширину полосы, распределенную по спектру, энергии с первой заранее заданной пропорцией текущего аудиокадра.

[0048] Специалист в данной области техники может понять, что первое заранее заданное значение и первая заранее заданная пропорция могут определяться в соответствии с экспериментом моделирования. Подходящее первое заранее заданное значение и первая заранее заданная пропорция могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется с использованием первого способа кодирования или второго способа кодирования. Как правило, значением первой заранее заданной пропорции является обычно число между 0 и 1 и относительно близко к 1, например, 90% или 80%. Выбор первого заранее заданного значения связан со значением первой заранее заданной пропорции и также связан с тенденций выбора между первым способом кодирования и вторым способом кодирования. Например, первое заранее заданное значение, соответствующее относительно большой первой заранее заданной пропорции обычно больше первого заранее заданного значения, соответствующего относительно малой первой заранее заданной пропорции. В качестве другого примера, первое заранее заданное значение, соответствующее тенденции выбора первого способа кодирования, обычно больше первого заранее заданного значения, соответствующего тенденции выбора второго способа кодирования.

[0049] Определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: сортировку энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определение, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров; и определение, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров. Например, входной аудиосигнал представляет собой широкополосный сигнал, дискретизированный с частотой 16 кГц, и входной сигнал вводится в кадр длительностью 20 мс. Каждый кадр сигнала представляет собой 320 точек дискретизации во временной области. Частотно-временное преобразование выполняется над сигналом временной области. Например, частотно-временное преобразование выполняется посредством быстрого преобразования Фурье (быстрое преобразование Фурье, FFT) для получения 160 огибающих S(k) спектра, т.е. 160 коэффициентов энергетического спектра FFT, где k=0, 1, 2, …, 159. Минимальная ширина полосы находится из огибающих S(k) спектра таким образом, что пропорция, которую энергия на ширине полосы составляет в полной энергии кадра, представляет собой первую заранее заданную пропорцию. Конкретно, определение минимальной ширины полосы, распределенной по спектру, энергии с первой заранее заданной пропорцией аудиокадра в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра аудиокадра включает в себя: последовательное накопление энергии частотных бинов в огибающих S(k) спектра в убывающем порядке; и сравнение энергии, полученной после каждого раза накопления, с полной энергией аудиокадра, и, если пропорция больше первой заранее заданной пропорции, завершение процесса накопления, где количество раз накопления представляет собой минимальную ширину полосы. Например, первая заранее заданная пропорция составляет 90%, и, если пропорция, которую сумма энергий, полученная после 30 раз накопления, составляет в полной энергии, превышает 90%, пропорция, которую сумма энергий, полученная после 29 раз накопления, составляет в полной энергии, меньше 90%, и пропорция, которую сумма энергий, полученная после 31 раза накопления, составляет в полной энергии, превышает пропорцию, которую сумма энергий, полученная после 30 раз накопления, составляет в полной энергии, может считаться, что минимальная ширина полосы, распределенная по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции аудиокадра, равна 30. Вышеупомянутый процесс определения минимальной ширины полосы выполняется для каждого из N аудиокадров, чтобы отдельно определять минимальные ширины полосы, распределенные по спектрам, энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров, включающих в себя текущий аудиокадр, и вычислять среднее значение N минимальных ширин полосы. Среднее значение N минимальных ширин полосы может упоминаться как первая минимальная ширина полосы, и первая минимальная ширина полосы может использоваться в качестве параметра общей разреженности. Когда первая минимальная ширина полосы меньше первого заранее заданного значения, определяется использование первого способа кодирования для кодирования текущего аудиокадра. Когда первая минимальная ширина полосы больше первого заранее заданного значения, определяется использование второго способа кодирования для кодирования текущего аудиокадра.

[0050] Необязательно, что в другом варианте осуществления параметр общей разреженности может включать в себя первую пропорцию энергии. В этом случае, определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: выбор P1 огибающих спектра из P огибающих спектра каждого из N аудиокадров; и определение первой пропорции энергии в соответствии с энергией P1 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, где P1 представляет собой положительное целое число, меньшее P. Определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя; когда первая пропорция энергии больше второго заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда первая пропорция энергии меньше второго заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра. Необязательно, что в варианте осуществления, когда N равно 1, N аудиокадров представляют собой текущий аудиокадр, и определение первой пропорции энергии в соответствии с энергией P1 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров включает в себя: определение первой пропорции энергии в соответствии с энергией P1 огибающих спектра текущего аудиокадра и полной энергией текущего аудиокадра.

[0051] Конкретно, первая пропорция энергии может вычисляться с использованием следующей формулы:

Формула 1.1

где R1 представляет первую пропорцию энергии, Ep1(n) представляет сумму энергий P1 выбранных огибающих спектра в n-м аудиокадре, Eall(n) представляет полную энергию n-го аудиокадра, и r(n) представляет пропорцию, которую энергия P1 огибающих спектра n-го аудиокадра в N аудиокадрах составляет в полной энергии аудиокадра.

[0052] Специалист в данной области техники может понять, что второе заранее заданное значение и выбор P1 огибающих спектра может определяться в соответствии с экспериментом моделирования. Подходящее второе заранее заданное значение, подходящее значение P1 и подходящий способ выбора P1 огибающих спектра могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется с использованием первого способа кодирования или второго способа кодирования. Как правило, значение P1 может представлять собой относительно малое число. Например, P1 выбирается таким образом, что пропорция P1 к P составляет меньше 20%. Для второго заранее заданного значения обычно не выбирается число, соответствующее чрезмерно малой пропорции. Например, число менее 10% не выбирается. Выбор второго заранее заданного значения связан со значением P1 и тенденцией выбора между первым способом кодирования и вторым способом кодирования. Например, второе заранее заданное значение, соответствующее относительно большому P1, обычно больше второго заранее заданного значения, соответствующего относительно малому P1. В качестве другого примера, второе заранее заданное значение, соответствующее тенденции выбора первого способа кодирования, обычно меньше второго заранее заданного значения, соответствующего тенденции выбора второго способа кодирования. Необязательно, что в варианте осуществления энергия любой одной из P1 огибающих спектра больше энергии любой одной из оставшихся (P-P1) огибающих спектра в P огибающих спектра.

[0053] Например, входной аудиосигнал представляет собой широкополосный сигнал, дискретизированный с частотой 16 кГц, и входной сигнал вводится в кадре с длительностью 20 мс. Каждый кадр сигнала представляет собой 320 точек дискретизации во временной области. Частотно-временное преобразование выполняется над сигналом временной области. Например, частотно-временное преобразование выполняется посредством быстрого преобразования Фурье для получения 160 огибающих S(k) спектра, где k=0, 1, 2, …, 159. P1 огибающих спектра выбираются из 160 огибающих спектра, и вычисляется пропорция, которую сумма энергий P1 огибающих спектра составляют в полной энергии аудиокадра. Вышеупомянутый процесс выполняется для каждого из N аудиокадров. Т.е. вычисляется пропорция, которую сумма энергий P1 огибающих спектра каждого из N аудиокадров составляет в соответствующей полной энергии. Вычисляется среднее значение пропорций. Среднее значение пропорций представляет собой первую пропорцию энергии. Когда первая пропорция энергии больше второго заранее заданного значения, определяется использование первого способа кодирования для кодирования текущего аудиокадра. Когда первая пропорция энергии меньше второго заранее заданного значения, определяется использование второго способа кодирования для кодирования текущего аудиокадра. Энергия любой одной из P1 огибающих спектра больше энергии любой одной из других огибающих спектра в P огибающих спектра, за исключением P1 огибающих спектра. Необязательно, что в варианте осуществления значением P1 может быть 20.

[0054] Необязательно, что в другом варианте осуществления параметр общей разреженности может включать в себя вторую минимальную ширину полосы и третью минимальную ширину полосы. В этом случае, определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее значение минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров используется в качестве второй минимальной ширины полосы, среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров используется в качестве третьей минимальной ширины полосы, и вторая заранее заданная пропорция меньше третьей заранее заданной пропорции. Определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: когда вторая минимальная ширина полосы меньше третьего заранее заданного значения, и третья минимальная ширина полосы меньше четвертого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; когда третья минимальная ширина полосы меньше пятого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда третья минимальная ширина полосы больше шестого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра. Четвертое заранее заданное значение больше или равно третьему заранее заданному значению, пятое заранее заданное значение меньше четвертого заранее заданного значения, и шестое заранее заданное значение больше четвертого заранее заданного значения. Необязательно, что в варианте осуществления, когда N равно 1, N аудиокадров представляют собой текущий аудиокадр. Определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров в качестве второй минимальной ширины полосы включает в себя: определение минимальной ширины полосы, распределенной по спектру, энергии со второй заранее заданной пропорцией текущего аудиокадра в качестве второй минимальной ширины полосы. Определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в качестве третьей минимальной ширины полосы включает в себя: определение минимальной ширины полосы, распределенной по спектру, энергии с третьей заранее заданной пропорцией текущего аудиокадра в качестве третьей минимальной ширины полосы.

[0055] Специалист в данной области техники может понять, что третье заранее заданное значение, четвертое заранее заданное значение, пятое заранее заданное значение, шестое заранее заданное значение, вторая заранее заданная пропорция и третья заранее заданная пропорция могут определяться в соответствии с экспериментом моделирования. Подходящие заранее заданные значения и заранее заданные пропорции могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется посредством использования первого способа кодирования или второго способа кодирования.

[0056] Определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: сортировку энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определение, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров; определение, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров; определение, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров; и определение, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров. Например, входной аудиосигнал представляет собой широкополосный сигнал, дискретизированный с частотой 16 кГц, и входной сигнал вводится в кадр длительностью 20 мс. Каждый кадр сигнала представляет собой 320 точек дискретизации во временной области. Частотно-временное преобразование выполняется над сигналом временной области. Например, частотно-временное преобразование выполняется посредством быстрого преобразования Фурье для получения 160 огибающих S(k) спектра, где k=0, 1, 2, …, 159. Минимальная ширина полосы находится из огибающих S(k) спектра таким образом, что пропорция, которую энергия на ширине полосы составляет в полной энергии кадра, представляет собой вторую заранее заданную пропорцию. Продолжается нахождение ширины полосы из огибающих S(k) спектра таким образом, что пропорция, которую энергия на ширине полосы составляет в полной энергии, представляет собой третью заранее заданную пропорцию. Конкретно, определение, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра аудиокадра, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции аудиокадра, и минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции аудиокадра включает в себя: последовательное накопление энергии частотных бинов в огибающих S(k) спектра в убывающем порядке. Энергия, полученная после каждого раза накопления, сравнивается с полной энергией аудиокадра, и, если пропорция больше второй заранее заданной пропорции, количество раз накопления представляет собой минимальную ширину полосы, которая удовлетворяет тому, что она не меньше второй заранее заданной пропорции. Накопление продолжается, и, если пропорция энергии, полученной после накопления, к полной энергии аудиокадра больше третьей заранее заданной пропорции, накопление завершается, и количество раз накопления представляет собой минимальную ширину полосы, которая удовлетворяет тому, что она не меньше третьей заранее заданной пропорции. Например, вторая заранее заданная пропорция равна 85%, и третья заранее заданная пропорция равна 95%. Если пропорция, которую сумма энергий, полученная после 30 раз накопления, составляет в полной энергии, превышает 85%, может считаться, что минимальная ширина полосы, распределенная по спектру, энергии со второй заранее заданной пропорцией аудиокадра, равна 30. Накопление продолжается, и, если пропорция, которую сумма энергий, полученная после 35 раз накопления, составляет в полной энергии, равна 95%, может считаться, что минимальная ширина полосы, распределенная по спектру, энергии с третьей заранее заданной пропорцией аудиокадра, равна 35. Вышеупомянутый процесс выполняется для каждого из N аудиокадров для отдельного определения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров, включающих в себя текущий аудиокадр, и минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров, включающих в себя текущий аудиокадр. Среднее значение минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров, равно второй минимальной ширине полосы. Среднее значение минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров, равно третьей минимальной ширине полосы. Когда вторая минимальная ширина полосы меньше третьего заранее заданного значения, и третья минимальная ширина полосы меньше четвертого заранее заданного значения, определяется использование первого способа кодирования для кодирования текущего аудиокадра. Когда третья минимальная ширина полосы меньше пятого заранее заданного значения, определяется использование первого способа кодирования для кодирования текущего аудиокадра. Когда третья минимальная ширина полосы больше шестого заранее заданного значения, определяется использование второго способа кодирования для кодирования текущего аудиокадра.

[0057] Необязательно, что в другом варианте осуществления параметр общей разреженности включает в себя вторую пропорцию энергии и третью пропорцию энергии. В этом случае, определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров включает в себя: выбор P2 огибающих спектра из P огибающих спектра каждого из N аудиокадров; определение второй пропорции энергии в соответствии с энергией P2 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров; выбор P3 огибающих спектра из P огибающих спектра каждого из N аудиокадров; и определение третьей пропорции энергии в соответствии с энергией P3 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров. Определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: когда вторая пропорция энергии больше седьмого заранее заданного значения, и третья пропорция энергии больше восьмого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; когда вторая пропорция энергии больше девятого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда третья пропорция энергии меньше десятого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра. P2 и P3 представляют собой положительные целые числа, которые меньше P, и P2 меньше P3. Необязательно, что в варианте осуществления, когда N равно 1, N аудиокадров представляют собой текущий аудиокадр. Определение второй пропорции энергии в соответствии с энергией P2 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров включает в себя: определение второй пропорции энергии в соответствии с энергией P2 огибающих спектра текущего аудиокадра и полной энергией текущего аудиокадра. Определение третьей пропорции энергии в соответствии с энергией P3 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров включает в себя: определение третьей пропорции энергии в соответствии с энергией P3 огибающих спектра текущего аудиокадра и полной энергией текущего аудиокадра.

[0058] Специалист в данной области техники может понять, что значения P2 и P3, седьмое заранее заданное значение, восьмое заранее заданное значение, девятое заранее заданное значение и десятое заранее заданное значение могут определяться в соответствии с экспериментом моделирования. Подходящие заранее заданные значения могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется посредством использования первого способа кодирования или второго способа кодирования. Необязательно, что в варианте осуществления P2 огибающих спектра могут представлять собой P2 огибающих спектра, имеющих максимальную энергию в P огибающих спектра; и P3 огибающих спектра могут представлять собой P3 огибающих спектра, имеющих максимальную энергию в P огибающих спектра.

[0059] Например, входной аудиосигнал представляет собой широкополосный сигнал, дискретизированный с частотой 16 кГц, и входной сигнал вводится в кадр длительностью 20 мс. Каждый кадр сигнала представляет собой 320 точек дискретизации во временной области. Частотно-временное преобразование выполняется над сигналом временной области. Например, частотно-временное преобразование выполняется посредством быстрого преобразования Фурье для получения 160 огибающих S(k) спектра, где k=0, 1, 2, …, 159. P2 огибающих спектра выбираются из 160 огибающих спектра, и вычисляется пропорция, которую сумма энергий P2 огибающих спектра составляет в полной энергии аудиокадра. Вышеупомянутый процесс выполняется для каждого из N аудиокадров. Т.е. вычисляется пропорция, которую сумма энергий P2 огибающих спектра каждого из N аудиокадров составляет в соответствующей полной энергии. Вычисляется среднее значение пропорций. Среднее значение пропорций представляет собой вторую пропорцию энергии. P3 огибающих спектра выбираются из 160 огибающих спектра, и вычисляется пропорция, которую сумма энергий P3 огибающих спектра составляет в полной энергии аудиокадра. Вышеупомянутый процесс выполняется для каждого из N аудиокадров. Т.е. вычисляется пропорция, которую сумма энергий P3 огибающих спектра каждого из N аудиокадров составляет в соответствующей полной энергии. Вычисляется среднее значение пропорций. Среднее значение пропорций представляет собой третью пропорцию энергии. Когда вторая пропорция энергии больше седьмого заранее заданного значения, и третья пропорция энергии больше восьмого заранее заданного значения, определяется использование первого способа кодирования для кодирования текущего аудиокадра. Когда вторая пропорция энергии больше девятого заранее заданного значения, определяется использование первого способа кодирования для кодирования текущего аудиокадра. Когда третья пропорция энергии меньше десятого заранее заданного значения, определяется использование второго способа кодирования для кодирования текущего аудиокадра. P2 огибающих спектра могут представлять собой P2 огибающих спектра, имеющих максимальную энергию в P огибающих спектра; и P3 огибающих спектра могут представлять собой P3 огибающих спектра, имеющих максимальную энергию в P огибающих спектра. Необязательно, что в варианте осуществления значение P2 может быть равно 20, и значение P3 может быть равно 30.

[0060] Необязательно, что в другом варианте осуществления подходящий способ кодирования может выбираться для текущего аудиокадра посредством использования разреженности всплесков. Для разреженности всплесков необходимо рассматривать глобальную разреженность, локальную разреженность и кратковременный всплеск распределения, по спектру, энергии аудиокадра. В этом случае, разреженность распределения энергии по спектрам может включать в себя глобальную разреженность, локальную разреженность и кратковременный всплеск распределения энергии по спектрам. В этом случае, значение N может быть равно 1, и N аудиокадров представляют собой текущий аудиокадр. Определение разреженности распределения, по спектрам, энергии N входных аудиокадров включает в себя: деление спектра текущего аудиокадра на Q подполос; и определение параметра разреженности всплесков в соответствии с пиковой энергией каждой из Q подполос спектра текущего аудиокадра, где параметр разреженности всплесков используется для указания глобальной разреженности, локальной разреженности и кратковременного всплеска текущего аудиокадра. Параметр разреженности всплесков включает в себя: глобальную пропорцию пиковой энергии к средней каждой из Q подполос, локальную пропорцию пиковой энергии к средней каждой из Q подполос, и кратковременное отклонение энергии каждой из Q подполос, где глобальная пропорция пиковой энергии к средней определяется в соответствии с пиковой энергией в подполосе и средней энергией всех подполос текущего аудиокадра, локальная пропорция пиковой энергии к средней определяется в соответствии с пиковой энергией в подполосе и средней энергией в подполосе, и кратковременное отклонение пиковой энергии определяется в соответствии с пиковой энергией в подполосе и пиковой энергией в конкретной полосе частот аудиокадра перед этим аудиокадром. Определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: определение, имеется ли первая подполоса в Q подполосах, где локальная пропорция пиковой энергии к средней первой подполосы больше одиннадцатого заранее заданного значения, глобальная пропорция пиковой энергии к средней первой подполосы больше двенадцатого заранее заданного значения, и кратковременное отклонение пиковой энергии первой подполосы больше тринадцатого заранее заданного значения; и, когда имеется первая подполоса в Q подполосах, определение использования первого способа кодирования для кодирования текущего аудиокадра. Глобальная пропорция пиковой энергии к средней каждой из Q подполос, локальная пропорция пиковой энергии к средней каждой из Q подполос и кратковременное отклонение энергии каждой из Q подполос соответственно представляет глобальную разреженность, локальную разреженность и кратковременный всплеск.

[0061] Конкретно, глобальная пропорция пиковой энергии к средней может определяться с использованием следующей формулы:

Формула 1.2

где e(i) представляет пиковую энергию i-й подполосы в Q подполосах, s(k) представляет энергию k-й огибающей спектра в P огибающих спектра, и p2s(i) представляет глобальную пропорцию пиковой энергии к средней i-й подполосы.

[0062] Локальная пропорция пиковой энергии к средней может определяться с использованием следующей формулы:

Формула 1.3

где e(i) представляет пиковую энергию i-й подполосы в Q подполосах, s(k) представляет энергию k-й огибающей спектра в P огибающих спектра, h(i) представляет индекс огибающей спектра, которая включена в i-ю подполосу, и которая имеет наибольшую частоту, l(i) представляет индекс огибающей спектра, которая включена в i-ю подполосу, и которая имеет наименьшую частоту, p2a(i) представляет локальную пропорцию пиковой энергии к средней i-й подполосы, и h(i) меньше или равно P-1.

[0063] Кратковременное отклонение пиковой энергии может определяться с использованием следующей формулы:

Формула 1.4

где e(i) представляет пиковую энергию i-й подполосы в Q подполосах текущего аудиокадра, и e1 и e2 представляют пиковую энергию конкретных полос частоты аудиокадров перед текущим аудиокадром. Конкретно, предполагая, что текущим аудиокадром является M-й аудиокадр, определяется огибающая спектра, в которой располагается пиковая энергия i-й подполосы текущего аудиокадра. Предполагается, что огибающей спектра, в которой располагается пиковая энергия, является i1. Определяется пиковая энергия в пределах диапазона от (i1-t)-й огибающей спектра до (i1+t)-й огибающей спектра в (M-1)-м аудиокадре, и пиковой энергией является e1. Аналогично, определяется пиковая энергия в пределах диапазона от (i1-t)-й огибающей спектра до (i1+t)-й огибающей спектра в (M-2)-м аудиокадре, и пиковой энергией является e2.

[0064] Специалист в данной области техники может понять, что одиннадцатое заранее заданное значение, двенадцатое заранее заданное значение и тринадцатое заранее заданное значение могут определяться в соответствии с экспериментом моделирования. Подходящие заранее заданные значения могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется с использованием первого способа кодирования.

[0065] Необязательно, что в другом варианте осуществления подходящий способ кодирования может выбираться для текущего аудиокадра посредством использования ограниченной полосой разреженности. В этом случае, разреженность распределения энергии по спектрам включает в себя ограниченную полосой разреженность распределения энергии по спектрам. В этом случае, определение разреженности распределения, по спектрам, энергии N входных аудиокадров включает в себя: определение разграничительной частоты каждого из N аудиокадров; и определение параметра ограниченной полосой разреженности в соответствии с разграничительной частотой каждого из N аудиокадров. Параметр ограниченной полосой разреженности может представлять собой среднее значение разграничительных частот N аудиокадров. Например, Ni-й аудиокадр представляет собой любой один из N аудиокадров, и диапазоном частот Ni-ого аудиокадра является от Fb до Fc, где Fb меньше Fc. Предполагая, что начальной частотой является Fb, способ определения разграничительной частоты Ni-го аудиокадра может выполнять поиск частоты Fs, начиная с Fb, где Fs удовлетворяет следующим условиям: пропорция суммы энергий от Fb до Fs к полной энергии Ni-го аудиокадра не меньше четвертой заранее заданной пропорции, и пропорция суммы энергий от Fb до любой частоты, меньшей Fs, к полной энергии Ni-го аудиокадра меньше четвертой заранее заданной пропорции, где Fs представляет собой разграничительную частоту Ni-го аудиокадра. Вышеупомянутый этап определения разграничительной частоты выполняется для каждого из N аудиокадров. Таким образом, может быть получено N разграничительных частот N аудиокадров. Определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, включает в себя: когда определяется, что параметр ограниченной полосой разреженности аудиокадров меньше четырнадцатого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра.

[0066] Специалист в данной области техники может понять, что четвертая заранее заданная пропорция и четырнадцатое заранее заданное значение могут определяться в соответствии с экспериментом моделирования. Подходящее заранее заданное значение и заранее заданная пропорция могут определяться в соответствии с экспериментом моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется с использованием первого способа кодирования. Как правило, число меньше 1, но близко к 1, например, 95% или 99%, выбирается в качестве значения четвертой заранее заданной пропорции. Для выбора четырнадцатого заранее заданного значения обычно не выбирается число, соответствующее относительно высокой частоте. Например, в некоторых вариантах осуществления, если диапазон частот аудиокадра составляет от 0 Гц до 8 кГц, число, меньшее частоты 5 кГц, может выбираться в качестве четырнадцатого заранее заданного значения.

[0067] Например, может определяться энергия каждой из P огибающих спектра текущего аудиокадра, и поиск разграничительной частоты выполняется с низкой частоты до высокой частоты таким образом, что пропорция, которую энергия, которая меньше разграничительной частоты, составляет в полной энергии текущего аудиокадра, представляет собой четвертую заранее заданную пропорцию. Предполагая, что N равно 1, разграничительной частотой текущего аудиокадра является параметр ограниченной полосой разреженности. Предполагая, что N представляет собой целое число больше 1, определяется, что среднее значение разграничительных частот N аудиокадров представляет собой параметр ограниченной полосой разреженности. Специалист в данной области может понять, что вышеупомянутое определение разграничительной частоты является просто примером. Альтернативно, способ определения разграничительной частоты может представлять собой поиск разграничительной частоты от высокой частоты до низкой частоты или может представлять собой другой способ.

[0068] Кроме того, чтобы избежать частое переключение между первым способом кодирования и вторым способом кодирования, может быть дополнительно установлен период продолжения прежнего состояния. Для аудиокадра в периоде продолжения прежнего состояния может использоваться способ кодирования, используемый для аудиокадра в начальном положении периода продолжения прежнего состояния. Таким образом, может исключаться снижение качества переключения, вызванное частым переключением между разными способами кодирования.

[0069] Если длительность продолжения прежнего состояния периода продолжения прежнего состояния составляет L, все L аудиокадров после текущего аудиокадра принадлежат периоду продолжения прежнего состояния текущего аудиокадра. Если разреженность распределения, по спектру, энергии аудиокадра, принадлежащего периоду продолжения прежнего состояния, отличается от разреженности распределения, по спектру, энергии аудиокадра в начальном положении периода продолжения прежнего состояния, аудиокадр все же кодируется посредством использования способа кодирования, которым является тот же, который использовался для аудиокадра в начальном положении периода продолжения прежнего состояния.

[0070] Длительность периода продолжения прежнего состояния может обновляться в соответствии с разреженностью распределения, по спектру, энергии аудиокадра в периоде продолжения прежнего состояния до тех пор, пока длительность периода продолжения прежнего состояния не будет равна 0.

[0071] Например, если определяется использование первого способа кодирования для I-го аудиокадра, и длительность заранее заданного периода продолжения прежнего состояния равна L, первый способ кодирования используется для от (I+1)-го аудиокадра до (I+L)-го аудиокадра. Тогда определяется разреженность распределения, по спектру, энергии (I+1)-го аудиокадра, и повторно вычисляется период продолжения прежнего состояния в соответствии с разреженностью распределения, по спектру, энергии (I+1)-го аудиокадра. Если (I+1)-й аудиокадр все еще удовлетворяет условию использования первого способа кодирования, последующим периодом продолжения прежнего состояния все еще является заранее заданный период L продолжения прежнего состояния. Т.е. период продолжения прежнего состояния начинается с (L+2)-го аудиокадра до (I+1+L)-го аудиокадра. Если (I+1)-й аудиокадр не удовлетворяет условию использования первого способа кодирования, период продолжения прежнего состояния повторно определяется в соответствии с разреженностью распределения, по спектру, энергии (I+1)-го аудиокадра. Например, повторно определяется, что период продолжения прежнего состояния равен L-L1, где L1 представляет собой положительное целое число, меньшее или равное L. Если L1 равно L, длительность периода продолжения прежнего состояния обновляется до 0. В этом случае, способ кодирования повторно определяется в соответствии с разреженностью распределения, по спектру, энергии (I+1)-го аудиокадра. Если L1 представляет собой целое число, меньшее L, способ кодирования повторно определяется в соответствии с разреженностью распределения, по спектру, энергии (I+1+L-L1)-го аудиокадра. Однако, так как (I+1)-й аудиокадр находится в периоде продолжения прежнего состояния I-го аудиокадра, (I+1)-й аудиокадр все же кодируется посредством использования первого способа кодирования. L1 может упоминаться как параметр обновления продолжения прежнего состояния, и значение параметра обновления продолжения прежнего состояния может определяться в соответствии с разреженностью распределения, по спектру, энергии входного аудиокадра. Таким образом, обновление периода продолжения прежнего состояния связано с разреженностью распределения, по спектру, энергии аудиокадра.

[0072] Например, когда определяется параметр общей разреженности, и параметр общей разреженности представляет собой первую минимальную ширину полосы, период продолжения прежнего состояния может повторно определяться в соответствии с минимальной шириной полосы, распределенной по спектру, энергии с первой заранее заданной пропорцией аудиокадра. Предполагается, что определяется использование первого способа кодирования для кодирования I-го аудиокадра, и заранее заданный период продолжения прежнего состояния равен L. Определяется минимальная ширина полосы, распределенная по спектру, энергии с первой заранее заданной пропорцией каждого из H последовательных аудиокадров, включающих в себя (I+1)-й аудиокадр, где H представляет собой положительное целое число больше 0. Если (I+1)-й аудиокадр не удовлетворяет условию использования первого способа кодирования, определяется количество аудиокадров, минимальные ширины полосы которого, распределенные по спектру, энергии с первой заранее заданной пропорцией меньше пятнадцатого заранее заданного значения (количество кратко упоминается как первый параметр продолжения прежнего состояния). Когда минимальная ширина полосы, распределенная по спектру, энергии с первой заранее заданной пропорцией (L+1)-го аудиокадра больше шестнадцатого заранее заданного значения и меньше семнадцатого заранее заданного значения, и первый параметр продолжения прежнего состояния меньше восемнадцатого заранее заданного значения, из длительности периода продолжения прежнего состояния вычитается 1, т.е. параметр обновления продолжения прежнего состояния равен 1. Шестнадцатое заранее заданное значение больше первого заранее заданного значения. Когда минимальная ширина полосы, распределенная по спектру, энергии с первой заранее заданной пропорцией (L+1)-го аудиокадра больше семнадцатого заранее заданного значения и меньше девятнадцатого заранее заданного значения, и первый параметр продолжения прежнего состояния меньше восемнадцатого заранее заданного значения, из длительности периода продолжения прежнего состояния вычитается 2, т.е. параметр обновления продолжения прежнего состояния равен 2. Когда минимальная ширина полосы, распределенная по спектру, энергии с первой заранее заданной пропорцией (L+1)-го аудиокадра больше девятнадцатого заранее заданного значения, период продолжения прежнего состояния устанавливается на 0. Когда первый параметр продолжения прежнего состояния и минимальная ширина полосы, распределенная по спектру, энергии с первой заранее заданной пропорцией (L+1)-го аудиокадра не удовлетворяет одному или нескольким от шестнадцатого заранее заданного значения до девятнадцатого заранее заданного значения, период продолжения прежнего состояния остается неизменным.

[0073] Специалист в данной области техники может понять, что заранее заданный период продолжения прежнего состояния может устанавливаться в соответствии с фактическим статусом, и параметр обновления продолжения прежнего состояния также может корректироваться в соответствии с фактическим статусом. Пятнадцатое заранее заданное значение - девятнадцатое заранее заданное значение могут корректироваться в соответствии с фактическим статусом, так что могут устанавливаться разные периоды продолжения прежнего состояния.

[0074] Аналогично, когда параметр общей разреженности включает в себя вторую минимальную ширину полосы и третью минимальную ширину полосы, или параметр общей разреженности включает в себя первую пропорцию энергии, или параметр общей разреженности включает в себя вторую пропорцию энергии и третьею пропорцию энергии, может устанавливаться соответствующий заранее заданный период продолжения прежнего состояния, соответствующий параметр обновления продолжения прежнего состояния и относящийся параметр, используемый для определения параметра обновления продолжения прежнего состояния, так что может определяться соответствующий период продолжения прежнего состояния, и исключается частое переключение между способами кодирования.

[0075] Когда способ кодирования определяется в соответствии с разреженностью всплесков (т.е. способ кодирования определяется в соответствии с глобальной разреженностью, локальной разреженностью и кратковременным всплеском распределения, по спектру, энергии аудиокадра), могут устанавливаться соответствующий период продолжения прежнего состояния и относящийся параметр, используемый для определения параметра обновления продолжения прежнего состояния, чтобы исключить частое переключение между способами кодирования. В этом случае, период продолжения прежнего состояния может быть меньше периода продолжения прежнего состояния, который устанавливается в случае параметра общей разреженности.

[0076] Когда способ кодирования определяется в соответствии с ограниченной полосой характеристикой распределения энергии по спектру, могут устанавливаться соответствующий период продолжения прежнего состояния, соответствующий параметр обновления продолжения прежнего состояния и относящийся параметр, используемый для определения параметра обновления продолжения прежнего состояния, чтобы исключить частое переключение между способами кодирования. Например, может вычисляться пропорция энергии нижней огибающей спектра входного аудиокадра к энергии всех огибающих спектра, и параметр обновления продолжения прежнего состояния определяется в соответствии с пропорцией. Конкретно, пропорция энергии нижней огибающей спектра к энергии всех огибающих спектра может определяться с использованием следующей формулы:

Формула 1.5

где Rlow представляет пропорцию энергии нижней огибающей спектра к энергии всех огибающих спектра, s(k) представляет энергию k-й огибающей спектра, y представляет индекс наивысшей огибающей спектра полосы нижних частот, и P указывает, что аудиокадр разделен на P огибающих спектра в совокупности. В этом случае, если Rlow больше двадцатого заранее заданного значения, параметр обновления продолжения прежнего состояния равен 0. В противном случае, если Rlow больше двадцать первого заранее заданного значения, параметр обновления продолжения прежнего состояния может иметь относительно небольшое значение, где двадцатое заранее заданное значение больше двадцать первого заранее заданного значения. Если Rlow не больше двадцать первого заранее заданного значения, параметр продолжения прежнего состояния может иметь относительно большое значение. Специалист в данной области техники может понять, что двадцатое заранее заданное значение и двадцать первое заранее заданное значение могут определяться в соответствии с экспериментом моделирования, и значение параметра обновления продолжения прежнего состояния также может определяться в соответствии с экспериментом. Как правило, число, которое является чрезмерно малой пропорцией, обычно не выбирается в качестве двадцать первого заранее заданного значения. Например, обычно может выбираться число больше 50%. Двадцатое заранее заданное значение находится в диапазоне между двадцать первым заранее заданным значением и 1.

[0077] Кроме того, когда способ кодирования определяется в соответствии с ограниченной полосой характеристикой распределения энергии по спектру, может дополнительно определяться разграничительная частота входного аудиокадра, и параметр обновления продолжения прежнего состояния определяется в соответствии с разграничительной частотой, где разграничительная частота может быть отличной от разграничительной частоты, используемой для определения параметра ограниченной полосой разреженности. Если разграничительная частота меньше двадцать второго заранее заданного значения, параметр обновления продолжения прежнего состояния равен 0. В противном случае, если разграничительная частота меньше двадцать третьего заранее заданного значения, параметр обновления продолжения прежнего состояния имеет относительно небольшое значение. Двадцать третье заранее заданное значение больше двадцать второго заранее заданного значения. Если разграничительная частота больше двадцать третьего заранее заданного значения, параметр обновления продолжения прежнего состояния может иметь относительно большое значение. Специалист в данной области техники может понять, что двадцать второе заранее заданное значение и двадцать третье заранее заданное значение могут определяться в соответствии с экспериментом моделирования, и значение параметра обновления продолжения прежнего состояния также может определяться в соответствии с экспериментом. Как правило, число, соответствующее относительно высокой частоте, не выбирается в качестве двадцать третьего заранее заданного значения. Например, если диапазон частот аудиокадра равен 0 Гц - 8 кГц, число меньше частоты 5 кГц может выбираться в качестве двадцать третьего заранее заданного значения.

[0078] Фиг.2 представляет собой конструктивную блок-схему устройства согласно варианту осуществления настоящего изобретения. Устройство 200, показанное на фиг.2, может выполнять этапы на фиг.1. Как показано на фиг.2, устройство 200 включает в себя блок 201 получения и блок 202 определения.

[0079] Блок 201 получения выполнен с возможностью получения N аудиокадров, где N аудиокадров включают в себя текущий аудиокадр, и N является положительным целым числом.

[0080] Блок 202 определения выполнен с возможностью определения разреженности распределения, по спектрам, энергии N аудиокадров, полученных блоком 201 получения.

[0081] Блок 202 определения дополнительно выполнен с возможностью определения, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, где первым способом кодирования является способ кодирования, который основан на частотно-временном преобразовании и квантовании коэффициентов преобразования, и который не основан на линейном предсказании, и вторым способом кодирования является способ кодирования на основе линейного предсказания.

[0082] В соответствии с устройством, показанным на фиг.2, когда кодируется аудиокадр, учитывается разреженность распределения, по спектру, энергии аудиокадра, что может уменьшить сложность кодирования и может гарантировать, что кодирование выполняется с относительно высокой точностью.

[0083] Во время выбора подходящего способа кодирования для аудиокадра может учитываться разреженность распределения, по спектру, энергии аудиокадра. Может быть три типа разреженности распределения, по спектру, энергии аудиокадра: общая разреженность, разреженность всплесков и ограниченная полосой разреженность.

[0084] Необязательно, что в варианте осуществления подходящий способ кодирования может выбираться для текущего аудиокадра посредством использования общей разреженности. В этом случае, блок 202 определения конкретно выполнен с возможностью деления спектра каждого из N аудиокадров на P огибающих спектра и определения параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где P представляет собой положительное целое число, и параметр общей разреженности указывает разреженность распределения, по спектрам, энергии N аудиокадров.

[0085] Конкретно, среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с конкретной пропорцией N входных последовательных аудиокадров может определяться в качестве общей разреженности. Меньшая ширина полосы указывает более сильную общую разреженность, и большая ширина полосы указывает более слабую общую разреженность. Другими словами, более сильная общая разреженность указывает, что энергия аудиокадра более централизована, и более слабая общая разреженность указывает, что энергия аудиокадра является более рассредоточенной. Эффективность является высокой, когда первый способ кодирования используется для кодирования аудиокадра, общая разреженность которого является относительно сильной. Поэтому, подходящий способ кодирования может выбираться посредством определения общей разреженности аудиокадра для кодирования аудиокадра. Чтобы способствовать определению общей разреженности аудиокадра, общая разреженность может квантоваться для получения параметра общей разреженности. Необязательно, что, когда N равно 1, общая разреженность представляет собой минимальную ширину полосы, распределенную по спектру, энергии с конкретной пропорцией текущего аудиокадра.

[0086] Необязательно, что в варианте осуществления параметр общей разреженности включает в себя первую минимальную ширину полосы. В этом случае, блок 202 определения конкретно выполнен с возможностью определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров представляет собой первую минимальную ширину полосы. Блок 202 определения конкретно выполнен с возможностью: когда первая минимальная ширина полосы меньше первого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда первая минимальная ширина полосы больше первого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра.

[0087] Специалист в данной области техники может понять, что первое заранее заданное значение и первая заранее заданная пропорция могут определяться в соответствии с экспериментом моделирования. Подходящее первое заранее заданное значение и первая заранее заданная пропорция могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется с использованием первого способа кодирования или второго способа кодирования.

[0088] Блок 202 определения конкретно выполнен с возможностью: сортировки энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров; и определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров. Например, аудиосигнал, полученный блоком 201 получения, представляет собой широкополосный сигнал, дискретизированный с частотой 16 кГц, и полученный аудиосигнал получается в кадре длительностью 20 мс. Каждый кадр сигнала представляет собой 320 точек дискретизации во временной области. Блок 202 определения может выполнять частотно-временное преобразование сигнала временной области, например, может выполнять частотно-временное преобразование посредством быстрого преобразования Фурье (быстрое преобразование Фурье, FFT) для получения 160 огибающих S(k) спектра, т.е. 160 коэффициентов энергетического спектра FFT, где k=0, 1, 2, …, 159. Блок 202 определения может находить минимальную ширину полосы из огибающих S(k) спектра таким образом, что пропорция, которую энергия на ширине полосы составляет в полной энергии кадра, представляет собой первую заранее заданную пропорцию. Конкретно, блок 202 определения может последовательно накапливать энергию частотных бинов в огибающих S(k) спектра в убывающем порядке; и может сравнивать энергию, полученную после каждого раза накопления, с полной энергией аудиокадра, и, если пропорция больше первой заранее заданной пропорции, может завершать процесс накопления, где количество раз накопления представляет собой минимальную ширину полосы. Например, первая заранее заданная пропорция равна 90%, и, если пропорция, которую сумма энергий, полученная после 30 раз накопления, составляет в полной энергии, превышает 90%, может считаться, что минимальная ширина полосы энергии, которая составляет не меньше первой заранее заданной пропорции аудиокадра, равна 30. Блок 202 определения может выполнять вышеупомянутый процесс определения минимальной ширины полосы для каждого из N аудиокадров, для отдельного определения минимальных ширин полосы энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров, включающих в себя текущий аудиокадр. Блок 202 определения может вычислять среднее значение минимальных ширин полосы энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров. Среднее значение минимальных ширин полосы энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров, может упоминаться как первая минимальная ширина полосы, и первая минимальная ширина полосы может использоваться в качестве параметра общей разреженности. Когда первая минимальная ширина полосы меньше первого заранее заданного значения, блок 202 определения может определять использование первого способа кодирования для кодирования текущего аудиокадра. Когда первая минимальная ширина полосы больше первого заранее заданного значения, блок 202 определения может определять использование второго способа кодирования для кодирования текущего аудиокадра.

[0089] Необязательно, что в другом варианте осуществления параметр общей разреженности может включать в себя первую пропорцию энергии. В этом случае, блок 202 определения конкретно выполнен с возможностью выбора P1 огибающих спектра из P огибающих спектра каждого из N аудиокадров, и определения первой пропорции энергии в соответствии с энергией P1 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, где P1 представляет собой положительное целое число меньше P. Блок 202 определения конкретно выполнен с возможностью: когда первая пропорция энергии больше второго заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда первая пропорция энергии меньше второго заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра. Необязательно, что в варианте осуществления, когда N равно 1, N аудиокадров представляют собой текущий аудиокадр, и блок 202 определения конкретно выполнен с возможностью определения первой пропорции энергии в соответствии с энергией P1 огибающих спектра текущего аудиокадра и полной энергией текущего аудиокадра. Блок 202 определения конкретно выполнен с возможностью определения P1 огибающих спектра в соответствии с энергией P огибающих спектра, где энергия любой одной из P1 огибающих спектра больше энергии любой одной из других огибающих спектра в P огибающих спектра, за исключением P1 огибающих спектра.

[0090] Конкретно, блок 202 определения может вычислять первую пропорцию энергии с использованием следующей формулы:

Формула 1.6

где R1 представляет первую пропорцию энергии, Ep1(n) представляет сумму энергий P1 выбранных огибающих спектра в n-м аудиокадре, Eall(n) представляет полную энергию n-го аудиокадра, и r(n) представляет пропорцию, которую энергия P1 огибающих спектра n-го аудиокадра в N аудиокадрах составляет в полной энергии аудиокадра.

[0091] Специалист в данной области техники может понять, что второе заранее заданное значение и выбор P1 огибающих спектра может определяться в соответствии с экспериментом моделирования. Подходящее второе заранее заданное значение, подходящее значение P1 и подходящий способ выбора P1 огибающих спектра могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется с использованием первого способа кодирования или второго способа кодирования. Необязательно, что в варианте осуществления P1 огибающих спектра могут представлять собой P1 огибающих спектра, имеющих максимальную энергию в P огибающих спектра.

[0092] Например, аудиосигнал, полученный блоком 201 получения, представляет собой широкополосный сигнал, дискретизированный с частотой 16 кГц, и полученный аудиосигнал получается в кадре длительностью 20 мс. Каждый кадр сигнала представляет собой 320 точек дискретизации во временной области. Блок 202 определения может выполнять частотно-временное преобразование сигнала временной области, например, может выполнять частотно-временное преобразование посредством быстрого преобразования Фурье для получения 160 огибающих S(k) спектра, где k=0, 1, 2, …, 159. Блок 202 определения может выбирать P1 огибающих спектра из 160 огибающих спектра, и может вычислять пропорцию, которую сумма энергий P1 огибающих спектра составляет в полной энергии аудиокадра. Блок 202 определения может выполнять вышеупомянутый процесс для каждого из N аудиокадров, т.е. может вычислять пропорцию, которую сумма энергий P1 огибающих спектра каждого из N аудиокадров составляет в соответствующей полной энергии. Блок 202 определения может вычислять среднее значение пропорций. Среднее значение пропорций представляет собой первую пропорцию энергии. Когда первая пропорция энергии больше второго заранее заданного значения, блок 202 определения может определять использование первого способа кодирования для кодирования текущего аудиокадра. Когда первая пропорция энергии меньше второго заранее заданного значения, блок 202 определения может определять использование второго способа кодирования для кодирования текущего аудиокадра. P1 огибающих спектра могут представлять собой P1 огибающих спектра, имеющих максимальную энергию в P огибающих спектра. Т.е. блок 202 определения конкретно выполнен с возможностью определения, из P огибающих спектра каждого из N аудиокадров, P1 огибающих спектра, имеющих максимальную энергию. Необязательно, что в варианте осуществления значение P1 может быть равно 20.

[0093] Необязательно, что в другом варианте осуществления параметр общей разреженности может включать в себя вторую минимальную ширину полосы и третью минимальную ширину полосы. В этом случае, блок 202 определения конкретно выполнен с возможностью определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее значение минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров используется в качестве второй минимальной ширины полосы, среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров используется в качестве третьей минимальной ширины полосы, и вторая заранее заданная пропорция меньше третьей заранее заданной пропорции. Блок 202 определения конкретно выполнен с возможностью: когда вторая минимальная ширина полосы меньше третьего заранее заданного значения, и третья минимальная ширина полосы меньше четвертого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; когда третья минимальная ширина полосы меньше пятого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда третья минимальная ширина полосы больше шестого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра. Необязательно, что в варианте осуществления, когда N равно 1, N аудиокадров представляют собой текущий аудиокадр. Блок 202 определения может определять минимальную ширину полосы, распределенную по спектру, энергии со второй заранее заданной пропорцией текущего аудиокадра в качестве второй минимальной ширины полосы. Блок 202 определения может определять минимальную ширину полосы, распределенную по спектру, энергии с третьей заранее заданной пропорцией текущего аудиокадра в качестве третьей минимальной ширины полосы.

[0094] Специалист в данной области техники может понять, что третье заранее заданное значение, четвертое заранее заданное значение, пятое заранее заданное значение, шестое заранее заданное значение, вторая заранее заданная пропорция и третья заранее заданная пропорция могут определяться в соответствии с экспериментом моделирования. Подходящие заранее заданные значения и заранее заданные пропорции могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется посредством использования первого способа кодирования или второго способа кодирования.

[0095] Блок 202 определения конкретно выполнен с возможностью: сортировки энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров; определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров; и определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров. Например, аудиосигнал, полученный блоком 201 получения, представляет собой широкополосный сигнал, дискретизированный с частотой 16 кГц, и полученный аудиосигнал получается в кадре длительностью 20 мс. Каждый кадр сигнала представляет собой 320 точек дискретизации во временной области. Блок 202 определения может выполнять частотно-временное преобразование сигнала временной области, например, может выполнять частотно-временное преобразование посредством быстрого преобразования Фурье для получения 160 огибающих S(k) спектра, где k=0, 1, 2, …, 159. Блок 202 определения может находить минимальную ширину полосы из огибающих S(k) спектра таким образом, что пропорция, которую энергия на ширине полосы составляет в полной энергии кадра, не меньше второй заранее заданной пропорции. Блок 202 определения может продолжать находить ширину полосы из огибающих S(k) спектра таким образом, что пропорция, которую энергия на ширине полосы составляет в полной энергии, не меньше третьей заранее заданной пропорции. Конкретно, блок 202 определения может последовательно накапливать энергию частотных бинов в огибающих S(k) спектра в убывающем порядке. Энергия, полученная после каждого раза накопления, сравнивается с полной энергией аудиокадра, и, если пропорция больше второй заранее заданной пропорции, количество раз накопления представляет собой минимальную ширину полосы, которая не меньше второй заранее заданной пропорции. Блок 202 накопления может продолжать накопление. Если пропорция энергии, полученной после накопления, к полной энергии аудиокадра больше третьей заранее заданной пропорции, накопление завершается, и количество раз накопления представляет собой минимальную ширину полосы, которая не меньше третьей заранее заданной пропорции. Например, вторая заранее заданная пропорция равна 85%, и третья заранее заданная пропорция равна 95%. Если пропорция, которую сумма энергий, полученная после 30 раз накопления, составляет в полной энергии, превышает 85%, может считаться, что минимальная ширина полосы, распределенная по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции аудиокадра, равна 30. Накопление продолжается, и, если пропорция, которую сумма энергий, полученная после 35 раз накопления, составляет в полной энергии, равна 95%, может считаться, что минимальная ширина полосы, распределенная по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции аудиокадра, равна 35. Блок 202 определения может выполнять вышеупомянутый процесс для каждого из N аудиокадров. Блок 202 определения может отдельно определять минимальные ширины полосы, распределенные по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров, включающих в себя текущий аудиокадр, и минимальные ширины полосы, распределенные по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров, включающих в себя текущий аудиокадр. Среднее значение минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров, представляет собой вторую минимальную ширину полосы. Среднее значение минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров, представляет собой третью минимальную ширину полосы. Когда вторая минимальная ширина полосы меньше третьего заранее заданного значения, и третья минимальная ширина полосы меньше четвертого заранее заданного значения, блок 202 определения может определять использование первого способа кодирования для кодирования текущего аудиокадра. Когда третья минимальная ширина полосы меньше пятого заранее заданного значения, блок 202 определения может определять использование первого способа кодирования для кодирования текущего аудиокадра. Когда третья минимальная ширина полосы больше первого заранее заданного значения, блок 202 определения может определять использование второго способа кодирования для кодирования текущего аудиокадра.

[0096] Необязательно, что в другом варианте осуществления параметр общей разреженности включает в себя вторую пропорцию энергии и третью пропорцию энергии. В этом случае, блок 202 определения конкретно выполнен с возможностью: выбора P2 огибающих спектра из P огибающих спектра каждого из N аудиокадров, определения второй пропорции энергии в соответствии с энергией P2 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, выбора P3 огибающих спектра из P огибающих спектра каждого из N аудиокадров, и определения третьей пропорции энергии в соответствии с энергией P3 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, где P2 и P3 представляют собой положительные целые числа меньше P, и P2 меньше P3. Блок 202 определения конкретно выполнен с возможностью: когда вторая пропорция энергии больше седьмого заранее заданного значения, и третья пропорция энергии больше восьмого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; когда вторая пропорция энергии больше девятого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда третья пропорция энергии меньше десятого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра. Необязательно, что в варианте осуществления, когда N равно 1, N аудиокадров представляют собой текущий аудиокадр. Блок 202 определения может определять вторую пропорцию энергии в соответствии с энергией P2 огибающих спектра текущего аудиокадра и полной энергией текущего аудиокадра. Блок 202 определения может определять третью пропорцию энергии в соответствии с энергией P3 огибающих спектра текущего аудиокадра и полной энергией текущего аудиокадра.

[0097] Специалист в данной области техники может понять, что значения P2 и P3, седьмое заранее заданное значение, восьмое заранее заданное значение, девятое заранее заданное значение и десятое заранее заданное значение могут определяться в соответствии с экспериментом моделирования. Подходящие заранее заданные значения могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется посредством использования первого способа кодирования или второго способа кодирования. Необязательно, что в варианте осуществления блок 202 определения конкретно выполнен с возможностью определения, из P огибающих спектра каждого из N аудиокадров, P2 огибающих спектра, имеющих максимальную энергию, и определения, из P огибающих спектра каждого из N аудиокадров, P3 огибающих спектра, имеющих максимальную энергию.

[0098] Например, аудиосигнал, полученный блоком 201 получения, представляет собой широкополосный сигнал, дискретизированный с частотой 16 кГц, и полученный аудиосигнал получается в кадре с длительностью 20 мс. Каждый кадр сигнала представляет собой 320 точек дискретизации во временной области. Блок 202 определения может выполнять частотно-временное преобразование сигнала временной области, например, может выполнять частотно-временное преобразование посредством быстрого преобразования Фурье для получения 160 огибающих S(k) спектра, где k=0, 1, 2, …, 159. Блок 202 определения может выбирать P2 огибающих спектра из 160 огибающих спектра и может вычислять пропорцию, которую сумма энергий P2 огибающих спектра составляет в полной энергии аудиокадра. Блок 202 определения может выполнять вышеупомянутый процесс для каждого из N аудиокадров, т.е. может вычислять пропорцию, которую сумма энергий P2 огибающих спектра каждого из N аудиокадров составляет в соответствующей полной энергии. Блок 202 определения может вычислять среднее значение пропорций. Среднее значение пропорций представляет собой вторую пропорцию энергии. Блок 202 определения может выбирать P3 огибающих спектра из 160 огибающих спектра и может вычислять пропорцию, которую сумма энергий P3 огибающих спектра составляет в полной энергии аудиокадра. Блок 202 определения может выполнять вышеупомянутый процесс для каждого из N аудиокадров, т.е. может вычислять пропорцию, которую сумма энергий P3 огибающих спектра каждого из N аудиокадров составляет в соответствующей полной энергии. Блок 202 определения может вычислять среднее значение пропорций. Среднее значение пропорций представляет собой третью пропорцию энергии. Когда вторая пропорция энергии больше седьмого заранее заданного значения, и третья пропорция энергии больше восьмого заранее заданного значения, блок 202 определения может определять использование первого способа кодирования для кодирования текущего аудиокадра. Когда вторая пропорция энергии больше девятого заранее заданного значения, блок 202 определения может определять использование первого способа кодирования для кодирования текущего аудиокадра. Когда третья пропорция энергии меньше десятого заранее заданного значения, блок 202 определения может определять использование второго способа кодирования для кодирования текущего аудиокадра. P2 огибающих спектра могут представлять собой P2 огибающих спектра, имеющих максимальную энергию в P огибающих спектра; и P3 огибающих спектра могут представлять собой P3 огибающих спектра, имеющих максимальную энергию в P огибающих спектра. Необязательно, что в варианте осуществления значение P2 может быть равно 20, и значение P3 может быть равно 30.

[0100] Необязательно, что в другом варианте осуществления подходящий способ кодирования может выбираться для текущего аудиокадра посредством использования разреженности всплесков. Для разреженности всплесков необходимо учитывать глобальную разреженность, локальную разреженность и кратковременный всплеск распределения, по спектру, энергии аудиокадра. В этом случае, разреженность распределения энергии по спектрам может включать в себя глобальную разреженность, локальную разреженность и кратковременный всплеск распределения энергии по спектрам. В этом случае, значение N может быть равно 1, и N аудиокадров представляют собой текущий аудиокадр. Блок 202 определения конкретно выполнен с возможностью деления спектра текущего аудиокадра на Q подполос, и определения параметра разреженности всплесков в соответствии с пиковой энергией каждой из Q подполос спектра текущего аудиокадра, где параметр разреженности всплесков используется для указания глобальной разреженности, локальной разреженности и кратковременного всплеска текущего аудиокадра.

[0101] Конкретно, блок 202 определения конкретно выполнен с возможностью определения глобальной пропорции пиковой энергии к средней каждой из Q подполос, локальной пропорции пиковой энергии к средней каждой из Q подполос и кратковременного отклонения энергии каждой из Q подполос, где глобальная пропорция пиковой энергии к средней определяется блоком 202 определения в соответствии с пиковой энергией в подполосе и средней энергией всех подполос текущего аудиокадра, локальная пропорция пиковой энергии к средней определяется блоком 202 определения в соответствии с пиковой энергией в подполосе и средней энергией в подполосе, и кратковременное отклонение пиковой энергии определяется в соответствии с пиковой энергией в подполосе и пиковой энергией в конкретной полосе частот аудиокадра перед этим аудиокадром. Глобальная пропорция пиковой энергии к средней каждой из Q подполос, локальная пропорция пиковой энергии к средней каждой из Q подполос и кратковременное отклонение энергии каждой из Q подполос соответственно представляет глобальную разреженность, локальную разреженность и кратковременный всплеск. Блок 202 определения конкретно выполнен с возможностью: определения, имеется ли первая подполоса в Q подполосах, где локальная пропорция пиковой энергии к средней первой подполосы больше одиннадцатого заранее заданного значения, глобальная пропорция пиковой энергии к средней первой подполосы больше двенадцатого заранее заданного значения, и кратковременное отклонение пиковой энергии первой подполосы больше тринадцатого заранее заданного значения; и, когда имеется первая подполоса в Q подполосах, определения использования первого способа кодирования для кодирования текущего аудиокадра.

[0102] Конкретно, блок 202 определения может вычислять глобальную пропорцию пиковой энергии к средней с использованием следующей формулы:

Формула 1.7

где e(i) представляет пиковую энергию i-й подполосы в Q подполосах, s(k) представляет энергию k-й огибающей спектра в P огибающих спектра, и p2s(i) представляет глобальную пропорцию пиковой энергии к средней i-й подполосы.

[0103] Блок 202 определения может вычислять локальную пропорция пиковой энергии к средней с использованием следующей формулы:

Формула 1.8

где e(i) представляет пиковую энергию i-й подполосы в Q подполосах, s(k) представляет энергию k-й огибающей спектра в P огибающих спектра, h(i) представляет индекс огибающей спектра, которая включена в i-ю подполосу, и которая имеет наибольшую частоту, l(i) представляет индекс огибающей спектра, которая включена в i-ю подполосу, и которая имеет наименьшую частоту, p2a(i) представляет локальную пропорцию пиковой энергии к средней i-й подполосы, и h(i) меньше или равно P-1.

[0104] Блок 202 определения может вычислять кратковременное отклонение пиковой энергии с использованием следующей формулы:

Формула 1.9

где e(i) представляет пиковую энергию i-й подполосы в Q подполосах текущего аудиокадра, и e1 и e2 представляют пиковую энергию конкретных полос частоты аудиокадров перед текущим аудиокадром. Конкретно, предполагая, что текущим аудиокадром является M-й аудиокадр, определяется огибающая спектра, в которой располагается пиковая энергия i-й подполосы текущего аудиокадра. Предполагается, что огибающей спектра, в которой располагается пиковая энергия, является i1. Определяется пиковая энергия в пределах диапазона от (i1-t)-й огибающей спектра до (i1+t)-й огибающей спектра в (M-1)-м аудиокадре, и пиковой энергией является e1. Аналогично, определяется пиковая энергия в пределах диапазона от (i1-t)-й огибающей спектра до (i1+t)-й огибающей спектра в (M-2)-м аудиокадре, и пиковой энергией является e2.

[0105] Специалист в данной области техники может понять, что одиннадцатое заранее заданное значение, двенадцатое заранее заданное значение и тринадцатое заранее заданное значение могут определяться в соответствии с экспериментом моделирования. Подходящие заранее заданные значения могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется с использованием первого способа кодирования.

[0106] Необязательно, что в другом варианте осуществления подходящий способ кодирования может выбираться для текущего аудиокадра посредством использования ограниченной полосой разреженности. В этом случае, разреженность распределения энергии по спектрам включает в себя ограниченную полосой разреженность распределения энергии по спектрам. В этом случае, блок 202 определения конкретно выполнен с возможностью определения разграничительной частоты каждого из N аудиокадров. Блок 202 определения конкретно выполнен с возможностью определения параметра ограниченной полосой разреженности в соответствии с разграничительной частотой каждого из N аудиокадров.

[0107] Специалист в данной области техники может понять, что четвертая заранее заданная пропорция и четырнадцатое заранее заданное значение могут определяться в соответствии с экспериментом моделирования. Подходящее заранее заданное значение и заранее заданная пропорция могут определяться в соответствии с экспериментом моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется с использованием первого способа кодирования.

[0108] Например, блок 202 определения может определять энергию каждой из P огибающих спектра текущего аудиокадра, и может выполнять поиск разграничительной частоты с низкой частоты до высокой частоты таким образом, что пропорция, которую энергия, которая меньше разграничительной частоты, составляет в полной энергии текущего аудиокадра, представляет собой четвертую заранее заданную пропорцию. Параметр ограниченной полосой разреженности может представлять собой среднее значение разграничительных частот N аудиокадров. В этом случае, блок 202 определения конкретно выполняется с возможностью: когда определяется, что параметр ограниченной полосой разреженности аудиокадров меньше четырнадцатого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра. Предполагая, что N равно 1, разграничительной частотой текущего аудиокадра является параметр ограниченной полосой разреженности. Предполагая, что N представляет собой целое число больше 1, блок 202 определения может определять, что среднее значение разграничительных частот N аудиокадров представляет собой параметр ограниченной полосой разреженности. Специалист в данной области техники может понять, что вышеупомянутое определение разграничительной частоты является просто примером. Альтернативно, способ определения разграничительной частоты может представлять собой поиск разграничительной частоты от высокой частоты до низкой частоты или может представлять собой другой способ.

[0109] Кроме того, чтобы избежать частого переключения между первым способом кодирования и вторым способом кодирования, блок 202 определения может быть дополнительно выполнен с возможностью установления периода продолжения прежнего состояния. Блок 202 определения может быть выполнен с возможностью: для аудиокадра в периоде продолжения прежнего состояния, использования способа кодирования для аудиокадра в начальном положении периода продолжения прежнего состояния. Таким образом, может исключаться снижение качества переключения, вызванное частым переключением между разными способами кодирования.

[0110] Если длительность продолжения прежнего состояния периода продолжения прежнего состояния равна L, блок 202 определения может быть выполнен с возможностью определения, что все L аудиокадров после текущего аудиокадра принадлежат периоду продолжения прежнего состояния текущего аудиокадра. Если разреженность распределения, по спектру, энергии аудиокадра, принадлежащего периоду продолжения прежнего состояния, отличается от разреженности распределения, по спектру, энергии аудиокадра в начальном положении периода продолжения прежнего состояния, блок 202 определения может быть выполнен с возможностью определения, что аудиокадр все же кодируется посредством использования способа кодирования, которым является тот же способ, который использовался для аудиокадра в начальном положении периода продолжения прежнего состояния.

[0111] Длительность периода продолжения прежнего состояния может обновляться в соответствии с разреженностью распределения, по спектру, энергии аудиокадра в периоде продолжения прежнего состояния до тех пор, пока длительность периода продолжения прежнего состояния не будет равна 0.

[0112] Например, если блок 202 определения определяет использование первого способа кодирования для I-го аудиокадра, и длительность заранее заданного периода продолжения прежнего состояния равна L, блок 202 определения может определять, что первый способ кодирования используется для от (I+1)-го аудиокадра до (I+L)-го аудиокадра. Тогда блок 202 определения может определять разреженность распределения, по спектру, энергии (I+1)-го аудиокадра и может повторно вычислять период продолжения прежнего состояния в соответствии с разреженностью распределения, по спектру, энергии (I+1)-го аудиокадра. Если (I+1)-й аудиокадр все еще удовлетворяет условию использования первого способа кодирования, блок 202 определения может определять, что последующим периодом продолжения прежнего состояния все еще является заранее заданный период L продолжения прежнего состояния. Т.е. период продолжения прежнего состояния начинается с (L+2)-го аудиокадра до (I+1+L)-го аудиокадра. Если (I+1)-й аудиокадр не удовлетворяет условию использования первого способа кодирования, блок 202 определения может повторно определять период продолжения прежнего состояния в соответствии с разреженностью распределения, по спектру, энергии (I+1)-го аудиокадра. Например, блок 202 определения может повторно определять, что период продолжения прежнего состояния равен L-L1, где L1 представляет собой положительное целое число, меньшее или равное L. Если L1 равно L, длительность периода продолжения прежнего состояния обновляется до 0. В этом случае, блок 202 определения может повторно определять способ кодирования в соответствии с разреженностью распределения, по спектру, энергии (I+1)-го аудиокадра. Если L1 представляет собой целое число меньше L, блок 202 определения может повторно определять способ кодирования в соответствии с разреженностью распределения, по спектру, энергии (I+1+L-L1)-го аудиокадра. Однако, так как (I+1)-й аудиокадр находится в периоде продолжения прежнего состояния I-го аудиокадра, (I+1)-й аудиокадр все же кодируется посредством использования первого способа кодирования. L1 может упоминаться как параметр обновления продолжения прежнего состояния, и значение параметра обновления продолжения прежнего состояния может определяться в соответствии с разреженностью распределения, по спектру, энергии входного аудиокадра. Таким образом, обновление периода продолжения прежнего состояния связано с разреженностью распределения, по спектру, энергии аудиокадра.

[0113] Например, когда определяется параметр общей разреженности, и параметр общей разреженности представляет собой первую минимальную ширину полосы, блок 202 определения может повторно определять период продолжения прежнего состояния в соответствии с минимальной шириной полосы, распределенной по спектру, энергии с первой заранее заданной пропорцией аудиокадра. Предполагается, что определяется использование первого способа кодирования для кодирования I-го аудиокадра, и заранее заданный период продолжения прежнего состояния равен L. Блок 202 определения может определять минимальную ширину полосы, распределенную по спектру, энергии с первой заранее заданной пропорцией каждого из H последовательных аудиокадров, включающих в себя (I+1)-й аудиокадр, где H представляет собой положительное целое число больше 0. Если (I+1)-й аудиокадр не удовлетворяет условию использования первого способа кодирования, блок 202 определения может определять количество аудиокадров, минимальные ширины полосы которого, распределенные по спектрам, энергии с первой заранее заданной пропорцией меньше пятнадцатого заранее заданного значения (количество кратко упоминается как первый параметр продолжения прежнего состояния). Когда минимальная ширина полосы, распределенная по спектру, энергии с первой заранее заданной пропорцией (L+1)-го аудиокадра больше шестнадцатого заранее заданного значения и меньше семнадцатого заранее заданного значения, и первый параметр продолжения прежнего состояния меньше восемнадцатого заранее заданного значения, блок 202 определения может вычитать 1 из длительности периода продолжения прежнего состояния, т.е. параметр обновления продолжения прежнего состояния равен 1. Шестнадцатое заранее заданное значение больше первого заранее заданного значения. Когда минимальная ширина полосы, распределенная по спектру, энергии с первой заранее заданной пропорцией (L+1)-го аудиокадра больше семнадцатого заранее заданного значения и меньше девятнадцатого заранее заданного значения, и первый параметр продолжения прежнего состояния меньше восемнадцатого заранее заданного значения, блок 202 определения может вычитать 2 из длительности периода продолжения прежнего состояния, т.е. параметр обновления продолжения прежнего состояния равен 2. Когда минимальная ширина полосы, распределенная по спектру, энергии с первой заранее заданной пропорцией (L+1)-го аудиокадра больше девятнадцатого заранее заданного значения, блок 202 определения может устанавливать период продолжения прежнего состояния на 0. Когда первый параметр продолжения прежнего состояния и минимальная ширина полосы, распределенная по спектру, энергии с первой заранее заданной пропорцией (L+1)-го аудиокадра не удовлетворяют одному или нескольким от шестнадцатого заранее заданного значения до девятнадцатого заранее заданного значения, блок 202 определения может определять, что период продолжения прежнего состояния остается неизменным.

[0114] Специалист в данной области техники может понять, что заранее заданный период продолжения прежнего состояния может устанавливаться в соответствии с фактическим статусом, и параметр обновления продолжения прежнего состояния также может корректироваться в соответствии с фактическим статусом. Пятнадцатое заранее заданное значение - девятнадцатое заранее заданное значение могут корректироваться в соответствии с фактическим статусом, так что могут устанавливаться разные периоды продолжения прежнего состояния.

[0115] Аналогично, когда параметр общей разреженности включает в себя вторую минимальную ширину полосы и третью минимальную ширину полосы, или параметр общей разреженности включает в себя первую пропорцию энергии, или параметр общей разреженности включает в себя вторую пропорцию энергии и третьею пропорцию энергии, блок 202 определения может устанавливать соответствующий заранее заданный период продолжения прежнего состояния, соответствующий параметр обновления продолжения прежнего состояния и относящийся параметр, используемый для определения параметра обновления продолжения прежнего состояния, так что может определяться соответствующий период продолжения прежнего состояния, и исключается частое переключение между способами кодирования.

[0116] Когда способ кодирования определяется в соответствии с разреженностью всплесков (т.е. способ кодирования определяется в соответствии с глобальной разреженностью, локальной разреженностью и кратковременным всплеском распределения, по спектру, энергии аудиокадра), блок 202 определения может устанавливать соответствующий период продолжения прежнего состояния, соответствующий параметр обновления продолжения прежнего состояния и относящийся параметр, используемый для определения параметра обновления продолжения прежнего состояния, чтобы исключить частое переключение между способами кодирования. В этом случае, период продолжения прежнего состояния может быть меньше периода продолжения прежнего состояния, который устанавливается в случае параметра общей разреженности.

[0117] Когда способ кодирования определяется в соответствии с ограниченной полосой характеристикой распределения энергии по спектру, блок 202 определения может устанавливать соответствующий период продолжения прежнего состояния, соответствующий параметр обновления продолжения прежнего состояния и относящийся параметр, используемый для определения параметра обновления продолжения прежнего состояния, чтобы исключить частое переключение между способами кодирования. Например, блок 202 определения может вычислять пропорцию энергии нижней огибающей спектра входного аудиокадра к энергии всех огибающих спектра, и может определять параметр обновления продолжения прежнего состояния в соответствии с пропорцией. Конкретно, блок 202 определения может определять пропорцию энергии нижней огибающей спектра к энергии всех огибающих спектра с использованием следующей формулы:

Формула 1.10

где Rlow представляет пропорцию энергии нижней огибающей спектра к энергии всех огибающих спектра, s(k) представляет энергию k-й огибающей спектра, y представляет индекс наивысшей огибающей спектра полосы нижних частот, и P указывает, что аудиокадр разделен в сумме на P огибающих спектра. В этом случае, если Rlow больше двадцатого заранее заданного значения, параметр обновления продолжения прежнего состояния равен 0. Если Rlow больше двадцать первого заранее заданного значения, параметр обновления продолжения прежнего состояния может иметь относительно небольшое значение, где двадцатое заранее заданное значение больше двадцать первого заранее заданного значения. Если Rlow не больше двадцать первого заранее заданного значения, параметр продолжения прежнего состояния может иметь относительно большое значение. Специалист в данной области техники может понять, что двадцатое заранее заданное значение и двадцать первое заранее заданное значение могут определяться в соответствии с экспериментом моделирования, и значение параметра обновления продолжения прежнего состояния также может определяться в соответствии с экспериментом.

[0118] Кроме того, когда способ кодирования определяется в соответствии с ограниченной полосой характеристикой распределения энергии по спектру, блок 202 определения может дополнительно определять разграничительную частоту входного аудиокадра и может определять параметр обновления продолжения прежнего состояния в соответствии с разграничительной частотой, где разграничительная частота может быть отличной от разграничительной частоты, используемой для определения параметра ограниченной полосой разреженности. Если разграничительная частота меньше двадцать второго заранее заданного значения, блок 202 определения может определять, что параметр обновления продолжения прежнего состояния равен 0. Если разграничительная частота меньше двадцать третьего заранее заданного значения, блок 202 определения может определять, что параметр обновления продолжения прежнего состояния имеет относительно небольшое значение. Если разграничительная частота больше двадцать третьего заранее заданного значения, блок 202 определения может определять, что параметр обновления продолжения прежнего состояния может иметь относительно большое значение. Специалист в данной области техники может понять, что двадцать второе заранее заданное значение и двадцать третье заранее заданное значение могут определяться в соответствии с экспериментом моделирования, и значение параметра обновления продолжения прежнего состояния также может определяться в соответствии с экспериментом.

[0119] Фиг.3 представляет собой конструктивную блок-схему устройства согласно варианту осуществления настоящего изобретения. Устройство 300, показанное на фиг.3, может выполнять этапы на фиг.1. Как показано на фиг.3, устройство 300 включает в себя процессор 301 и память 302.

[0120] Компоненты в устройстве 300 связаны посредством использования системы 303 шин. Система 303 шин дополнительно включает в себя шину источника питания, шину управления и шину сигнала статуса в дополнение к шине данных. Однако для упрощения понятного описания все шины отмечены как система 303 шин на фиг.3.

[0121] Способ, описанный в вышеупомянутых вариантах осуществления настоящего изобретения, может быть применен к процессору 301 или реализован на процессоре 301. Процессор 301 может представлять собой интегральную микросхему и имеет возможности для обработки сигнала. В процессе реализации этапы способа могут выполняться посредством использования интегральной логической схемы аппаратных средств в процессоре 301 или инструкции в программной форме. Процессор 301 может представлять собой процессор общего назначения, процессор цифровой обработки сигналов (Digital Signal Processor, DSP), специализированную интегральную схему (Application Specific Integrated Circuit, ASIC), программируемую вентильную матрицу (Field Programmable Gate Array, FPGA) или другое программируемое логическое устройство, устройство дискретной вентильной или транзисторной логики или дискретный аппаратный компонент. Процессор 301 может реализовывать или исполнять способы, этапы и логические блок-схемы, описанные в вариантах осуществления настоящего изобретения. Процессор общего назначения может представлять собой микропроцессор, или процессором может быть любой общий процессор, и т.п. Этапы способов, описанных с ссылкой на варианты осуществления настоящего изобретения, могут непосредственно исполняться и завершаться посредством аппаратного процессора декодирования или могут исполняться и завершаться посредством использования комбинации аппаратных и программных модулей в процессоре декодирования. Программный модуль может располагаться на носителе данных, который хорошо известен в технике, таком как оперативное запоминающее устройство (Random Access Memory, RAM), флэш-память, постоянное запоминающее устройство (Read-Only Memory, ROM), программируемое постоянное запоминающее устройство или электрически стираемое программируемое запоминающее устройство или регистр. Носитель данных располагается в памяти 302. Процессор 301 считывает инструкцию из памяти 302 и выполняет этапы способа в комбинации с его аппаратными средствами.

[0122] Процессор 301 выполнен с возможностью получения N аудиокадров, где N аудиокадров включают в себя текущий аудиокадр, и N является положительным целым числом.

[0123] Процессор 301 выполнен с возможностью определения разреженности распределения, по спектрам, энергии N аудиокадров, полученных процессором 301.

[0124] Процессор 301 дополнительно выполнен с возможностью определения, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, где первым способом кодирования является способ кодирования, который основан на частотно-временном преобразовании и квантовании коэффициентов преобразования, и который не основывается на линейном предсказании, и вторым способом кодирования является способ кодирования, основанный на линейном предсказании.

[0125] Согласно устройству, показанному на фиг.3, когда кодируется аудиокадр, учитывается разреженность распределения, по спектру, энергии аудиокадра, что может уменьшить сложность кодирования и гарантировать, что кодирование выполняется с относительно высокой точностью.

[0126] Во время выбора подходящего способа кодирования для аудиокадра, может учитываться разреженность распределения, по спектру, энергии аудиокадра. Может быть три типа разреженности распределения, по спектру, энергии аудиокадра: общая разреженность, разреженность всплесков и ограниченная полосой разреженность.

[0127] Необязательно, что в варианте осуществления, подходящий способ кодирования может выбираться для текущего аудиокадра посредством использования общей разреженности. В этом случае, процессор 301 конкретно выполнен с возможностью деления спектра каждого из N аудиокадров на P огибающих спектра, и определения параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где P представляет собой положительное целое число, и параметр общей разреженности указывает разреженность распределения, по спектрам, энергии N аудиокадров.

[0128] Конкретно, среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с конкретной пропорцией N входных последовательных аудиокадров может определяться как общая разреженность. Меньшая ширина полосы указывает более сильную общую разреженность, и большая ширина полосы указывает более слабую общую разреженность. Другими словами, более сильная общая разреженность указывает, что энергия аудиокадра более централизована, и более слабая общая разреженность указывает, что энергия аудиокадра более рассредоточена. Эффективность является высокой, когда используется первый способ кодирования для кодирования аудиокадра, общая разреженность которого является относительно сильной. Поэтому, подходящий способ кодирования может выбираться посредством определения общей разреженности аудиокадра для кодирования аудиокадра. Чтобы способствовать определению общей разреженности аудиокадра, общая разреженность может квантоваться для получения параметра общей разреженности. Необязательно, что, когда N равно 1, общая разреженность представляет собой минимальную ширину полосы, распределенную по спектру, энергии с конкретной пропорцией текущего аудиокадра.

[0129] Необязательно, что в варианте осуществления параметр общей разреженности включает в себя первую минимальную ширину полосы. В этом случае, процессор 301 конкретно выполнен с возможностью определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров представляет собой первую минимальную ширину полосы. Процессор 301 конкретно выполнен с возможностью: когда первая минимальная ширина полосы меньше первого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда первая минимальная ширина полосы больше первого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра.

[0130] Специалист в данной области техники может понять, что первое заранее заданное значение и первая заранее заданная пропорция могут определяться в соответствии с экспериментом моделирования. Подходящее первое заранее заданное значение и первая заранее заданная пропорция могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется с использованием первого способа кодирования или второго способа кодирования.

[0131] Процессор 301 конкретно выполнен с возможностью: сортировки энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров; и определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров. Например, аудиосигнал, полученный процессором 301, представляет собой широкополосный сигнал, дискретизированный с частотой 16 кГц, и полученный аудиосигнал получается в кадре с длительностью 30 мс. Каждый кадр сигнала представляет собой 330 точек дискретизации во временной области. Процессор 301 может выполнять частотно-временное преобразование сигнала временной области, например, может выполнять частотно-временное преобразование посредством быстрого преобразования Фурье (быстрое преобразование Фурье, FFT) для получения 130 огибающих S(k) спектра, т.е. 130 коэффициентов энергетического спектра FFT, где k=0, 1, 2, …, 159. Процессор 301 может находить минимальную ширину полосы из огибающих S(k) спектра таким образом, что пропорция, которую энергия на ширине полосы составляет в полной энергии кадра, представляет собой первую заранее заданную пропорцию. Конкретно, процессор 301 может последовательно накапливать энергию частотных бинов в огибающих S(k) спектра в убывающем порядке; и сравнивать энергию, полученную после каждого раза накопления, с полной энергией аудиокадра, и, если пропорция больше первой заранее заданной пропорции, может завершать процесс накопления, где количество раз накопления представляет собой минимальную ширину полосы. Например, первая заранее заданная пропорция составляет 90%, и, если пропорция, которую сумма энергий, полученная после 30 раз накопления, составляет в полной энергии, превышает 90%, может считаться, что минимальная ширина полосы энергии, которая составляет не меньше первой заранее заданной пропорции аудиокадра, равна 30. Процессор 301 может выполнять вышеупомянутый процесс определения минимальной ширины полосы для каждого из N аудиокадров, чтобы отдельно определять минимальные ширины полосы энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров, включающих в себя текущий аудиокадр. Процессор 301 может вычислять среднее значение минимальных ширин полосы энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров. Среднее значение минимальных ширин полосы энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров, может упоминаться как первая минимальная ширина полосы, и первая минимальная ширина полосы может использоваться в качестве параметра общей разреженности. Когда первая минимальная ширина полосы меньше первого заранее заданного значения, процессор 301 может определять использование первого способа кодирования для кодирования текущего аудиокадра. Когда первая минимальная ширина полосы больше первого заранее заданного значения, процессор 301 может определять использование второго способа кодирования для кодирования текущего аудиокадра.

[0132] Необязательно, что в другом варианте осуществления параметр общей разреженности может включать в себя первую пропорцию энергии. В этом случае, процессор 301 конкретно выполнен с возможностью выбора P1 огибающих спектра из P огибающих спектра каждого из N аудиокадров, и определения первой пропорции энергии в соответствии с энергией P1 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, где P1 представляет собой положительное целое число меньше P. Процессор 301 конкретно выполнен с возможностью: когда первая пропорция энергии больше второго заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда первая пропорция энергии меньше второго заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра. Необязательно, что в варианте осуществления, когда N равно 1, N аудиокадров представляют собой текущий аудиокадр, и процессор 301 конкретно выполнен с возможностью определения первой пропорции энергии в соответствии с энергией P1 огибающих спектра текущего аудиокадра и полной энергией текущего аудиокадра. Процессор 301 конкретно выполнен с возможностью определения P1 огибающих спектра в соответствии с энергией P огибающих спектра, где энергия любой одной из P1 огибающих спектра больше энергии любой одной из других огибающих спектра в P огибающих спектра, за исключением P1 огибающих спектра.

[0133] Конкретно, процессор 301 может вычислять первую пропорцию энергии с использованием следующей формулы:

Формула 1.6

где R1 представляет первую пропорцию энергии, Ep1(n) представляет сумму энергий P1 выбранных огибающих спектра в n-м аудиокадре, Eall(n) представляет полную энергию n-го аудиокадра, и r(n) представляет пропорцию, которую энергия P1 огибающих спектра n-го аудиокадра в N аудиокадрах составляет в полной энергии аудиокадра.

[0134] Специалист в данной области техники может понять, что второе заранее заданное значение и выбор P1 огибающих спектра может определяться в соответствии с экспериментом моделирования. Подходящее второе заранее заданное значение, подходящее значение P1 и подходящий способ выбора P1 огибающих спектра могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется с использованием первого способа кодирования или второго способа кодирования. Необязательно, что в варианте осуществления P1 огибающих спектра могут представлять собой P1 огибающих спектра, имеющих максимальную энергию в P огибающих спектра.

[0135] Например, аудиосигнал, полученный процессором 301, представляет собой широкополосный сигнал, дискретизированный с частотой 16 кГц, и полученный аудиосигнал получается в кадре с длительностью 30 мс. Каждый кадр сигнала представляет собой 330 точек дискретизации во временной области. Процессор 301 может выполнять частотно-временное преобразование сигнала временной области, например, может выполнять частотно-временное преобразование посредством быстрого преобразования Фурье для получения 130 огибающих S(k) спектра, где k=0, 1, 2, …, 159. Процессор 301 может выбирать P1 огибающих спектра из 130 огибающих спектра и может вычислять пропорцию, которую сумма энергий P1 огибающих спектра составляет в полной энергии аудиокадра. Процессор 301 может выполнять вышеупомянутый процесс для каждого из N аудиокадров, т.е. может вычислять пропорцию, которую сумма энергий P1 огибающих спектра каждого из N аудиокадров составляет в соответствующей полной энергии. Процессор 301 может вычислять среднее значение пропорций. Среднее значение пропорций представляет собой первую пропорцию энергии. Когда первая пропорция энергии больше второго заранее заданного значения, процессор 301 может определять использование первого способа кодирования для кодирования текущего аудиокадра. Когда первая пропорция энергии меньше второго заранее заданного значения, процессор 301 может определять использование второго способа кодирования для кодирования текущего аудиокадра. P1 огибающих спектра могут представлять собой P1 огибающих спектра, имеющих максимальную энергию в P огибающих спектра. Т.е. процессор 301 конкретно выполнен с возможностью определения, из P огибающих спектра каждого из N аудиокадров, P1 огибающих спектра, имеющих максимальную энергию. Необязательно, что в варианте осуществления значение P1 может быть равно 30.

[0136] Необязательно, что в другом варианте осуществления параметр общей разреженности может включать в себя вторую минимальную ширину полосы и третью минимальную ширину полосы. В этом случае, процессор 301 конкретно выполнен с возможностью определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, где среднее значение минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров используется в качестве второй минимальной ширины полосы, среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров используется в качестве третьей минимальной ширины полосы, и вторая заранее заданная пропорция меньше третьей заранее заданной пропорции. Процессор 301 конкретно выполнен с возможностью: когда вторая минимальная ширина полосы меньше третьего заранее заданного значения, и третья минимальная ширина полосы меньше четвертого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; когда третья минимальная ширина полосы меньше пятого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда третья минимальная ширина полосы больше шестого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра. Необязательно, что в варианте осуществления, когда N равно 1, N аудиокадров представляют собой текущий аудиокадр. Процессор 301 может определять минимальную ширину полосы, распределенную по спектру, энергии со второй заранее заданной пропорцией текущего аудиокадра в качестве второй минимальной ширины полосы. Процессор 301 может определять минимальную ширину полосы, распределенную по спектру, энергии с третьей заранее заданной пропорцией текущего аудиокадра в качестве третьей минимальной ширины полосы.

[0137] Специалист в данной области техники может понять, что третье заранее заданное значение, четвертое заранее заданное значение, пятое заранее заданное значение, шестое заранее заданное значение, вторая заранее заданная пропорция и третья заранее заданная пропорция могут определяться в соответствии с экспериментом моделирования. Подходящие заранее заданные значения и заранее заданные пропорции могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется посредством использования первого способа кодирования или второго способа кодирования.

[0138] Процессор 301 конкретно выполнен с возможностью: сортировки энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров; определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров; и определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров. Например, аудиосигнал, полученный процессором 301, представляет собой широкополосный сигнал, дискретизированный с частотой 16 кГц, и полученный аудиосигнал получается в кадре с длительностью 30 мс. Каждый кадр сигнала представляет собой 330 точек дискретизации во временной области. Процессор 301 может выполнять частотно-временное преобразование сигнала временной области, например, может выполнять частотно-временное преобразование посредством быстрого преобразования Фурье для получения 130 огибающих S(k) спектра, где k=0, 1, 2, …, 159. Процессор 301 может находить минимальную ширину полосы из огибающих S(k) спектра таким образом, что пропорция, которую энергия на ширине полосы составляет в полной энергии кадра, не меньше второй заранее заданной пропорции. Процессор 301 может продолжать нахождение ширины полосы из огибающих S(k) спектра таким образом, что пропорция, которую энергия на ширине полосы составляет в полной энергии, не меньше третьей заранее заданной пропорции. Конкретно, процессор 301 может последовательно накапливать энергию частотных бинов в огибающих S(k) спектра в убывающем порядке. Энергия, полученная после каждого раза накопления, сравнивается с полной энергией аудиокадра, и, если пропорция больше второй заранее заданной пропорции, количество раз накопления представляет собой минимальную ширину полосы, которая не меньше второй заранее заданной пропорции. Процессор 301 может продолжать накопление. Если пропорция энергии, полученной после накопления, к полной энергии аудиокадра больше третьей заранее заданной пропорции, накопление завершается, и количество раз накопления представляет собой минимальную ширину полосы, которая не меньше третьей заранее заданной пропорции. Например, вторая заранее заданная пропорция равна 85%, и третья заранее заданная пропорция равна 95%. Если пропорция, которую сумма энергий, полученная после 30 раз накопления, составляет в полной энергии, превышает 85%, может считаться, что минимальная ширина полосы, распределенная по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции аудиокадра, равна 30. Накопление продолжается, и, если пропорция, которую сумма энергий, полученная после 35 раз накопления, составляет в полной энергии, равна 95%, может считаться, что минимальная ширина полосы, распределенная по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции аудиокадра, равна 35. Процессор 301 может выполнять вышеупомянутый процесс для каждого из N аудиокадров. Процессор 301 может отдельно определять минимальные ширины полосы, распределенные по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров, включающих в себя текущий аудиокадр, и минимальные ширины полосы, распределенные по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров, включающих в себя текущий аудиокадр. Среднее значение минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров, представляет собой вторую минимальную ширину полосы. Среднее значение минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров, представляет собой третью минимальную ширину полосы. Когда вторая минимальная ширина полосы меньше третьего заранее заданного значения, и третья минимальная ширина полосы меньше четвертого заранее заданного значения, процессор 301 может определять использование первого способа кодирования для кодирования текущего аудиокадра. Когда третья минимальная ширина полосы меньше пятого заранее заданного значения, процессор 301 может определять использование первого способа кодирования для кодирования текущего аудиокадра. Когда третья минимальная ширина полосы больше шестого заранее заданного значения, процессор 301 может определять использование второго способа кодирования для кодирования текущего аудиокадра.

[0139] Необязательно, что в другом варианте осуществления параметр общей разреженности включает в себя вторую пропорцию энергии и третью пропорцию энергии. В этом случае, процессор 301 конкретно выполнен с возможностью: выбора P2 огибающих спектра из P огибающих спектра каждого из N аудиокадров; определения второй пропорции энергии в соответствии с энергией P2 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, выбора P3 огибающих спектра из P огибающих спектра каждого из N аудиокадров, и определения третьей пропорции энергии в соответствии с энергией P3 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, где P2 и P3 представляют собой положительные целые числа меньше P, и P2 меньше P3. Процессор 301 конкретно выполнен с возможностью: когда вторая пропорция энергии больше седьмого заранее заданного значения, и третья пропорция энергии больше восьмого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; когда вторая пропорция энергии больше девятого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда третья пропорция энергии меньше десятого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра. Необязательно, что в варианте осуществления, когда N равно 1, N аудиокадров представляют собой текущий аудиокадр. Процессор 301 может определять вторую пропорцию энергии в соответствии с энергией P2 огибающих спектра текущего аудиокадра и полной энергией текущего аудиокадра. Процессор 301 может определять третью пропорцию энергии в соответствии с энергией P3 огибающих спектра текущего аудиокадра и полной энергией текущего аудиокадра.

[0140] Специалист в данной области техники может понять, что значения P2 и P3, седьмое заранее заданное значение, восьмое заранее заданное значение, девятое заранее заданное значение и десятое заранее заданное значение могут определяться в соответствии с экспериментом моделирования. Подходящие заранее заданные значения могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется с использованием первого способа кодирования или второго способа кодирования. Необязательно, что в варианте осуществления процессор 301 конкретно выполнен с возможностью определения, из P огибающих спектра каждого из N аудиокадров, P2 огибающих спектра, имеющих максимальную энергию, и определения, из P огибающих спектра каждого из N аудиокадров, P3 огибающих спектра, имеющих максимальную энергию.

[0141] Например, аудиосигнал, полученный процессором 301, представляет собой широкополосный сигнал, дискретизированный с частотой 16 кГц, и полученный аудиосигнал получается в кадре с длительностью 30 мс. Каждый кадр сигнала представляет собой 330 точек дискретизации во временной области. Процессор 301 может выполнять частотно-временное преобразование сигнала временной области, например, может выполнять частотно-временное преобразование посредством быстрого преобразования Фурье для получения 130 огибающих S(k) спектра, где k=0, 1, 2, …, 159. Процессор 301 может выбирать P2 огибающих спектра из 130 огибающих спектра, и может вычислять пропорцию, которую сумма энергий P2 огибающих спектра составляет в полной энергии аудиокадра. Процессор 301 может выполнять вышеупомянутый процесс для каждого из N аудиокадров, т.е. может вычислять пропорцию, которую сумма энергий P2 огибающих спектра каждого из N аудиокадров составляет в соответствующей полной энергии. Процессор 301 может вычислять среднее значение пропорций. Среднее значение пропорций представляет собой вторую пропорцию энергии. Процессор 301 может выбирать P3 огибающих спектра из 130 огибающих спектра и может вычислять пропорцию, которую сумма энергий P3 огибающих спектра составляет в полной энергии аудиокадра. Процессор 301 может выполнять вышеупомянутый процесс для каждого из N аудиокадров, т.е. может вычислять пропорцию, которую сумма энергий P3 огибающих спектра каждого из N аудиокадров составляет в соответствующей полной энергии. Процессор 301 может вычислять среднее значение пропорций. Среднее значение пропорций представляет собой третью пропорцию энергии. Когда вторая пропорция энергии больше седьмого заранее заданного значения, и третья пропорция энергии больше восьмого заранее заданного значения, процессор 301 может определять использование первого способа кодирования для кодирования текущего аудиокадра. Когда вторая пропорция энергии больше девятого заранее заданного значения, процессор 301 может определять использование первого способа кодирования для кодирования текущего аудиокадра. Когда третья пропорция энергии меньше десятого заранее заданного значения, процессор 301 может определять использование второго способа кодирования для кодирования текущего аудиокадра. P2 огибающих спектра могут представлять собой P2 огибающих спектра, имеющих максимальную энергию в P огибающих спектра; и P3 огибающих спектра могут представлять собой P3 огибающих спектра, имеющих максимальную энергию в P огибающих спектра. Необязательно, что в варианте осуществления значение P2 может быть равно 30, и значение P3 может быть равно 30.

[0142] Необязательно, что в другом варианте осуществления подходящий способ кодирования может выбираться для текущего аудиокадра посредством использования разреженности всплесков. Для разреженности всплесков необходимо учитывать глобальную разреженность, локальную разреженность и кратковременный всплеск распределения, по спектру, энергии аудиокадра. В этом случае, разреженность распределения энергии по спектрам может включать в себя глобальную разреженность, локальную разреженность и кратковременный всплеск распределения энергии по спектрам. В этом случае, значение N может быть равно 1, и N аудиокадров представляют собой текущий аудиокадр. Процессор 301 конкретно выполнен с возможностью деления спектра текущего аудиокадра на Q подполос; и определения параметра разреженности всплесков в соответствии с пиковой энергией каждой из Q подполос спектра текущего аудиокадра, где параметр разреженности всплесков используется для указания глобальной разреженности, локальной разреженности и кратковременного всплеска текущего аудиокадра.

[0143] Конкретно, процессор 301 конкретно выполнен с возможностью определения глобальной пропорции пиковой энергии к средней каждой из Q подполос, локальной пропорции пиковой энергии к средней каждой из Q подполос и кратковременного отклонения энергии каждой из Q подполос, где глобальная пропорция пиковой энергии к средней определяется процессором 301 в соответствии с пиковой энергией в подполосе и средней энергией всех подполос текущего аудиокадра, локальная пропорция пиковой энергии к средней определяется процессором 301 в соответствии с пиковой энергией в подполосе и средней энергией в подполосе, и кратковременное отклонение пиковой энергии определяется в соответствии с пиковой энергией в подполосе и пиковой энергией в конкретной полосе частот аудиокадра перед этим аудиокадром. Глобальная пропорция пиковой энергии к средней каждой из Q подполос, локальная пропорция пиковой энергии к средней каждой из Q подполос и кратковременное отклонение энергии каждой из Q подполос соответственно представляет глобальную разреженность, локальную разреженность и кратковременный всплеск. Процессор 301 конкретно выполнен с возможностью: определения, имеется ли первая подполоса в Q подполосах, где локальная пропорция пиковой энергии к средней первой подполосы больше одиннадцатого заранее заданного значения, глобальная пропорция пиковой энергии к средней первой подполосы больше двенадцатого заранее заданного значения, и кратковременное отклонение пиковой энергии первой подполосы больше тринадцатого заранее заданного значения; и, когда имеется первая подполоса в Q подполосах, определения использования первого способа кодирования для кодирования текущего аудиокадра.

[0144] Конкретно, процессор 301 может вычислять глобальную пропорцию пиковой энергии к средней с использованием следующей формулы:

Формула 1.7

где e(i) представляет пиковую энергию i-й подполосы в Q подполосах, s(k) представляет энергию k-й огибающей спектра в P огибающих спектра, и p2s(i) представляет глобальную пропорцию пиковой энергии к средней i-й подполосы.

[0145] Процессор 301 может вычислять локальную пропорцию пиковой энергии к средней с использованием следующей формулы:

Формула 1.8

где e(i) представляет пиковую энергию i-й подполосы в Q подполосах, s(k) представляет энергию k-й огибающей спектра в P огибающих спектра, h(i) представляет индекс огибающей спектра, которая включена в i-ю подполосу, и которая имеет наибольшую частоту, l(i) представляет индекс огибающей спектра, которая включена в i-ю подполосу, и которая имеет наименьшую частоту, p2a(i) представляет локальную пропорцию пиковой энергии к средней i-й подполосы, и h(i) меньше или равно P-1.

[0146] Процессор 301 может вычислять кратковременное отклонение пиковой энергии с использованием следующей формулы:

Формула 1.9

где e(i) представляет пиковую энергию i-й подполосы в Q подполосах текущего аудиокадра, и e1 и e2 представляют пиковую энергию конкретных полос частоты аудиокадров перед текущим аудиокадром. Конкретно, предполагая, что текущим аудиокадром является M-й аудиокадр, определяется огибающая спектра, в которой располагается пиковая энергия i-й подполосы текущего аудиокадра. Предполагается, что огибающей спектра, в которой располагается пиковая энергия, является i1. Определяется пиковая энергия в пределах диапазона от (i1-t)-й огибающей спектра до (i1+t)-й огибающей спектра в (M-1)-м аудиокадре, и пиковой энергией является e1. Аналогично, определяется пиковая энергия в пределах диапазона от (i1-t)-й огибающей спектра до (i1+t)-й огибающей спектра в (M-2)-м аудиокадре, и пиковой энергией является e2.

[0147] Специалист в данной области техники может понять, что одиннадцатое заранее заданное значение, двенадцатое заранее заданное значение и тринадцатое заранее заданное значение могут определяться в соответствии с экспериментом моделирования. Подходящие заранее заданные значения могут определяться посредством эксперимента моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется с использованием первого способа кодирования.

[0148] Необязательно, что в другом варианте осуществления подходящий способ кодирования может выбираться для текущего аудиокадра посредством использования ограниченной полосой разреженности. В этом случае, разреженность распределения энергии по спектрам включает в себя ограниченную полосой разреженность распределения энергии по спектрам. В этом случае, процессор 301 конкретно выполнен с возможностью определения разграничительной частоты каждого из N аудиокадров. Процессор 301 конкретно выполнен с возможностью определения параметра ограниченной полосой разреженности в соответствии с разграничительной частотой каждого из N аудиокадров.

[0149] Специалист в данной области техники может понять, что четвертая заранее заданная пропорция и четырнадцатое заранее заданное значение могут определяться в соответствии с экспериментом моделирования. Подходящее заранее заданное значение и заранее заданная пропорция могут определяться в соответствии с экспериментом моделирования, так что может быть получен хороший эффект кодирования, когда аудиокадр, удовлетворяющий вышеупомянутому условию, кодируется с использованием первого способа кодирования.

[0150] Например, процессор 301 может определять энергию каждой из P огибающих спектра текущего аудиокадра и может выполнять поиск разграничительной частоты с низкой частоты до высокой частоты таким образом, что пропорция, которую энергия, которая меньше разграничительной частоты, составляет в полной энергии текущего аудиокадра, равна четвертой заранее заданной пропорции. Параметр ограниченной полосой разреженности может представлять собой среднее значение разграничительных частот N аудиокадров. В этом случае, процессор 301 конкретно выполняется с возможностью: когда определяется, что параметр ограниченной полосой разреженности аудиокадров меньше четырнадцатого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра. Предполагая, что N равно 1, разграничительной частотой текущего аудиокадра является параметр ограниченной полосой разреженности. Предполагая, что N представляет собой целое число больше 1, процессор 301 может определять, что среднее значение разграничительных частот N аудиокадров представляет собой параметр ограниченной полосой разреженности. Специалист в данной области техники может понять, что вышеупомянутое определение разграничительной частоты является просто примером. Альтернативно, способ определения разграничительной частоты может представлять собой поиск разграничительной частоты от высокой частоты до низкой частоты или может представлять собой другой способ.

[0151] Кроме того, чтобы избежать частого переключения между первым способом кодирования и вторым способом кодирования, процессор 301 может быть дополнительно выполнен с возможностью установления периода продолжения прежнего состояния. Процессор 301 может быть выполнен с возможностью: для аудиокадра в периоде продолжения прежнего состояния, использования способа кодирования, используемого для аудиокадра в начальном положении периода продолжения прежнего состояния. Таким образом, может исключаться снижение качества переключения, вызванное частым переключением между разными способами кодирования.

[0152] Если длительность продолжения прежнего состояния периода продолжения прежнего состояния равна L, процессор 301 может быть выполнен с возможностью определения, что все L аудиокадров после текущего аудиокадра принадлежат периоду продолжения прежнего состояния текущего аудиокадра. Если разреженность распределения, по спектру, энергии аудиокадра, принадлежащего периоду продолжения прежнего состояния, отличается от разреженности распределения, по спектру, энергии аудиокадра в начальном положении периода продолжения прежнего состояния, процессор 301 может быть выполнен с возможностью определения, что аудиокадр все же кодируется посредством использования способа кодирования, которым является тот же, который использовался для аудиокадра в начальном положении периода продолжения прежнего состояния.

[0153] Длительность периода продолжения прежнего состояния может обновляться в соответствии с разреженностью распределения, по спектру, энергии аудиокадра в периоде продолжения прежнего состояния до тех пор, пока длительность периода продолжения прежнего состояния не будет равна 0.

[0154] Например, если процессор 301 определяет использование первого способа кодирования для I-го аудиокадра, и длительность заранее заданного периода продолжения прежнего состояния равна L, процессор 301 может определять, что первый способ кодирования используется для от (I+1)-го аудиокадра до (I+L)-го аудиокадра. Тогда процессор 301 может определять разреженность распределения, по спектру, энергии (I+1)-го аудиокадра и может повторно вычислять период продолжения прежнего состояния в соответствии с разреженностью распределения, по спектру, энергии (I+1)-го аудиокадра. Если (I+1)-й аудиокадр все еще удовлетворяет условию использования первого способа кодирования, процессор 301 может определять, что последующим периодом продолжения прежнего состояния все еще является заранее заданный период L продолжения прежнего состояния. Т.е. период продолжения прежнего состояния начинается с (L+2)-го аудиокадра до (I+1+L)-го аудиокадра. Если (I+1)-й аудиокадр не удовлетворяет условию использования первого способа кодирования, процессор 301 может повторно определить период продолжения прежнего состояния в соответствии с разреженностью распределения, по спектру, энергии (I+1)-го аудиокадра. Например, процессор 301 может повторно определить, что период продолжения прежнего состояния равен L-L1, где L1 представляет собой положительное целое число, меньшее или равное L. Если L1 равно L, длительность периода продолжения прежнего состояния обновляется до 0. В этом случае, процессор 301 может повторно определить способ кодирования в соответствии с разреженностью распределения, по спектру, энергии (I+1)-го аудиокадра. Если L1 представляет собой целое число меньше L, процессор 301 может повторно определить способ кодирования в соответствии с разреженностью распределения, по спектру, энергии (I+1+L-L1)-го аудиокадра. Однако, так как (I+1)-й аудиокадр находится в периоде продолжения прежнего состояния I-го аудиокадра, (I+1)-й аудиокадр все же кодируется посредством использования первого способа кодирования. L1 может упоминаться как параметр обновления продолжения прежнего состояния, и значение параметра обновления продолжения прежнего состояния может определяться в соответствии с разреженностью распределения, по спектру, энергии входного аудиокадра. Таким образом, обновление периода продолжения прежнего состояния связано с разреженностью распределения, по спектру, энергии аудиокадра.

[155] Например, когда определяется параметр общей разреженности, и параметр общей разреженности представляет собой первую минимальную ширину полосы, процессор 301 может повторно определять период продолжения прежнего состояния в соответствии с минимальной шириной полосы, распределенной по спектру, энергии с первой заранее заданной пропорцией аудиокадра. Предполагается, что определяется использование первого способа кодирования для кодирования I-го аудиокадра, и заранее заданный период продолжения прежнего состояния равен L. Процессор 301 может определять минимальную ширину полосы, распределенную по спектру, энергии с первой заранее заданной пропорцией каждого из H последовательных аудиокадров, включающих в себя (I+1)-й аудиокадр, где H представляет собой положительное целое число больше 0. Если (I+1)-й аудиокадр не удовлетворяет условию использования первого способа кодирования, процессор 301 может определять количество аудиокадров, минимальные ширины полосы которых, распределенные по спектрам, энергии с первой заранее заданной пропорцией меньше пятнадцатого заранее заданного значения (количество кратко упоминается как первый параметр продолжения прежнего состояния). Когда минимальная ширина полосы, распределенная по спектру, энергии с первой заранее заданной пропорцией (L+1)-го аудиокадра больше шестнадцатого заранее заданного значения и меньше семнадцатого заранее заданного значения, и первый параметр продолжения прежнего состояния меньше восемнадцатого заранее заданного значения, процессор 301 может вычитать 1 из длительности периода продолжения прежнего состояния, т.е. параметр обновления продолжения прежнего состояния равен 1. Шестнадцатое заранее заданное значение больше первого заранее заданного значения. Когда минимальная ширина полосы, распределенная по спектру, энергии с первой заранее заданной пропорцией (L+1)-го аудиокадра больше семнадцатого заранее заданного значения и меньше девятнадцатого заранее заданного значения, и первый параметр продолжения прежнего состояния меньше восемнадцатого заранее заданного значения, процессор 301 может вычитать 2 из длительности периода продолжения прежнего состояния, т.е. параметр обновления продолжения прежнего состояния равен 2. Когда минимальная ширина полосы, распределенная по спектру, энергии с первой заранее заданной пропорцией (L+1)-го аудиокадра больше девятнадцатого заранее заданного значения, процессор 301 может устанавливать период продолжения прежнего состояния на 0. Когда первый параметр продолжения прежнего состояния и минимальная ширина полосы, распределенная по спектру, энергии с первой заранее заданной пропорцией (L+1)-го аудиокадра не удовлетворяет одному или нескольким от шестнадцатого заранее заданного значения до девятнадцатого заранее заданного значения, процессор 301 может определять, что период продолжения прежнего состояния остается неизменным.

[0156] Специалист в данной области техники может понять, что заранее заданный период продолжения прежнего состояния может устанавливаться в соответствии с фактическим статусом, и параметр обновления продолжения прежнего состояния также может корректироваться в соответствии с фактическим статусом. Пятнадцатое заранее заданное значение - девятнадцатое заранее заданное значение могут корректироваться в соответствии с фактическим статусом, так что могут устанавливаться разные периоды продолжения прежнего состояния.

[0157] Аналогично, когда параметр общей разреженности включает в себя вторую минимальную ширину полосы и третью минимальную ширину полосы, или параметр общей разреженности включает в себя первую пропорцию энергии, или параметр общей разреженности включает в себя вторую пропорцию энергии и третьею пропорцию энергии, процессор 301 может устанавливать соответствующий заранее заданный период продолжения прежнего состояния, соответствующий параметр обновления продолжения прежнего состояния и относящийся параметр, используемый для определения параметра обновления продолжения прежнего состояния, так что может определяться соответствующий период продолжения прежнего состояния, и исключается частое переключение между способами кодирования.

[0158] Когда способ кодирования определяется в соответствии с разреженностью всплесков (т.е. способ кодирования определяется в соответствии с глобальной разреженностью, локальной разреженностью и кратковременным всплеском распределения, по спектру, энергии аудиокадра), процессор 301 может устанавливать соответствующий период продолжения прежнего состояния, соответствующий параметр обновления продолжения прежнего состояния и относящийся параметр, используемый для определения параметра обновления продолжения прежнего состояния, чтобы исключить частое переключение между способами кодирования. В этом случае, период продолжения прежнего состояния может быть меньше периода продолжения прежнего состояния, который устанавливается в случае параметра общей разреженности.

[0159] Когда способ кодирования определяется в соответствии с ограниченной полосой характеристикой распределения энергии по спектру, процессор 301 может устанавливать соответствующий период продолжения прежнего состояния, соответствующий параметр обновления продолжения прежнего состояния и относящийся параметр, используемый для определения параметра обновления продолжения прежнего состояния, чтобы исключить частое переключение между способами кодирования. Например, процессор 301 может вычислять пропорцию энергии нижней огибающей спектра входного аудиокадра к энергии всех огибающих спектра и может определять параметр обновления продолжения прежнего состояния в соответствии с пропорцией. Конкретно, процессор 301 может определять пропорцию энергии нижней огибающей спектра к энергии всех огибающих спектра с использованием следующей формулы:

Формула 1.10

где Rlow представляет пропорцию энергии нижней огибающей спектра к энергии всех огибающих спектра, s(k) представляет энергию k-й огибающей спектра, y представляет индекс наивысшей огибающей спектра полосы низких частот, и P указывает, что аудиокадр разделен на P огибающих спектра в сумме. В этом случае, если Rlow больше двадцатого заранее заданного значения, параметр обновления продолжения прежнего состояния равен 0. Если Rlow больше двадцать первого заранее заданного значения, параметр обновления продолжения прежнего состояния может иметь относительно небольшое значение, где двадцатое заранее заданное значение больше двадцать первого заранее заданного значения. Если Rlow не больше двадцать первого заранее заданного значения, параметр продолжения прежнего состояния может иметь относительно большое значение. Специалист в данной области техники может понять, что двадцатое заранее заданное значение и двадцать первое заранее заданное значение могут определяться в соответствии с экспериментом моделирования, и значение параметра обновления продолжения прежнего состояния также может определяться в соответствии с экспериментом.

[0160] Кроме того, когда способ кодирования определяется в соответствии с ограниченной полосой характеристикой распределения энергии по спектру, процессор 301 может дополнительно определять разграничительную частоту входного аудиокадра и может определять параметр обновления продолжения прежнего состояния в соответствии с разграничительной частотой, где разграничительная частота может быть отличной от разграничительной частоты, используемой для определения параметра ограниченной полосой разреженности. Если разграничительная частота меньше двадцать второго заранее заданного значения, процессор 301 может определять, что параметр обновления продолжения прежнего состояния равен 0. Если разграничительная частота меньше двадцать третьего заранее заданного значения, процессор 301 может определять, что параметр обновления продолжения прежнего состояния имеет относительно небольшое значение. Если разграничительная частота больше двадцать третьего заранее заданного значения, процессор 301 может определять, что параметр обновления продолжения прежнего состояния может иметь относительно большое значение. Специалист в данной области техники может понять, что двадцать второе заранее заданное значение и двадцать третье заранее заданное значение могут определяться в соответствии с экспериментом моделирования, и значение параметра обновления продолжения прежнего состояния также может определяться в соответствии с экспериментом.

[0161] Специалист в данной области техники может быть в курсе, что в комбинации с примерами, описанными в вариантах осуществления, раскрытых в данном описании изобретения, блоки и этапы алгоритма могут быть реализованы электронными аппаратными средствами или комбинацией программных и электронных аппаратных средств компьютера. Выполняются ли функции аппаратными или программными средствами, зависит от конкретных применений и условий конструктивных ограничений технических решений. Специалист в данной области техники может использовать разные способы для реализации описанных функций для каждого конкретного применения, но не следует считать, что реализация выходит за пределы объема настоящего изобретения.

[0162] Для специалиста в данной области техники может быть безусловно понятно, что, с целью удобного и краткого описания, для подробного рабочего процесса вышеупомянутой системы, устройства и блока, ссылка может быть сделана на соответствующий процесс в вышеупомянутых вариантах осуществления способа, и подробности здесь не описываются.

[0163] В нескольких вариантах осуществления, предусмотренных в настоящей заявке, необходимо понять, что описанная система, устройство и способ могут быть реализованы другим образом. Например, описанный вариант осуществления устройства является просто примерным. Например, деление на блоки представляет собой просто деление по логическим функциям и может быть другое деление в фактической реализации. Например, множество блоков или компонентов может быть объединено или интегрировано в другую систему, или некоторые признаки могут игнорироваться или не выполняться. Кроме того, изображенные или описанные взаимные связи, или прямые связи, или соединения передачи данных могут быть реализованы посредством некоторых интерфейсов. Непрямые связи или соединения передачи данных между устройствами или блоками могут быть реализованы в электронном, механическом или других видах.

[0164] Блоки, описанные как отдельные элементы, могут быть или могут не быть физически отдельными, и элементы, изображенные как блоки, могут быть или могут не быть физическими блоками, могут располагаться в одном положении, или могут распределяться по множеству сетевых блоков. Часть блоков или все блоки могут выбираться в соответствии с фактическими потребностями для достижения цели решений вариантов осуществления.

[0165] Кроме того, функциональные блоки в вариантах осуществления настоящего изобретения могут быть интегрированы в один блок обработки, или каждый из блоков может существовать физически самостоятельно, или два или более блоков интегрируются в один блок.

[0166] Если функции реализованы в виде программного функционального блока и продаются или используются в виде независимого продукта, функции могут сохраняться на считываемом компьютером носителе данных. Основываясь на таком понимании, технические решения настоящего изобретения, в основном, или часть, вносящая вклад в известный уровень техники, или часть технических решений могут быть реализованы в виде программного продукта. Программный продукт сохраняется на носителе данных и включает в себя несколько инструкций для инструктирования компьютерного устройства (которым может быть персональный компьютер, сервер или сетевое устройство) или процессора на выполнение всех или части этапов способов, описанных в вариантах осуществления настоящего изобретения. Вышеупомянутый носитель данных включает в себя: любой носитель, который может хранить программный код, такой как флэш-память USB (универсальная последовательная шина), съемный жесткий диск, постоянное запоминающее устройство (ROM, Read-Only Memory), оперативное запоминающее устройство (RAM, Random Access Memory), магнитный диск или оптический диск.

[0167] Вышеприведенные описания представляют собой просто конкретные варианты осуществления настоящего изобретения, но не предназначены для ограничения объема защиты настоящего изобретения. Любая разновидность или замена, легко осуществляемая специалистом в данной области техники в пределах технического объема, описанного в настоящем изобретении, подпадает под объем защиты настоящего изобретения. Поэтому, объем защиты настоящего изобретения должен подпадать под объем защиты формулы изобретения.

1. Способ кодирования аудио, который содержит:

определение разреженности распределения, по спектрам, энергии N входных аудиокадров, в котором разреженность распределения определена для каждого из N входных аудиокадров, в котором N аудиокадров содержат текущий аудиокадр и N представляет собой положительное целое число; и

определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, причем первый способ кодирования представляет собой способ кодирования, который основывается на частотно-временном преобразовании и квантовании коэффициентов преобразования и который не основывается на линейном предсказании, и второй способ кодирования представляет собой способ кодирования на основе линейного предсказания.

2. Способ по п.1, в котором определение разреженности распределения, по спектрам, энергии N входных аудиокадров содержит:

деление спектра каждого из N аудиокадров на P коэффициентов энергетического спектра FFT, причем P представляет собой положительное целое число; и

определение параметра общей разреженности в соответствии с энергией P коэффициентов энергетического спектра FFT каждого из N аудиокадров, причем параметр общей разреженности указывает разреженность распределения, по спектрам, энергии N аудиокадров.

3. Способ по п.2, в котором параметр общей разреженности содержит первую минимальную ширину полосы;

определение параметра общей разреженности в соответствии с энергией P коэффициентов энергетического спектра FFT каждого из N аудиокадров содержит:

определение среднего значения минимальных ширин полосы распределения, по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P коэффициентов энергетического спектра FFT каждого из N аудиокадров, причем минимальная ширина полосы находится из P коэффициентов энергетического спектра FFT таким образом, что пропорция, которую энергия на ширине полосы составляет в полной энергии кадра, представляет собой первую заранее заданную пропорцию, причем среднее значение минимальных ширин полосы распределения, по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров представляет собой первую минимальную ширину полосы; и

определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, содержит:

когда первая минимальная ширина полосы меньше первого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда первая минимальная ширина полосы больше первого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра.

4. Способ по п.3, в котором определение среднего значения минимальных ширин полосы распределения, по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P коэффициентов энергетического спектра FFT каждого из N аудиокадров содержит:

сортировку энергии P коэффициентов энергетического спектра FFT каждого аудиокадра в убывающем порядке;

определение, в соответствии с энергией, отсортированной в убывающем порядке, P коэффициентов энергетического спектра FFT каждого из N аудиокадров, минимальной ширины полосы распределения, по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров; и

определение, в соответствии с минимальной шириной полосы распределения, по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы распределения, по спектрам, энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров.

5. Способ по п.2, в котором параметр общей разреженности содержит первую пропорцию энергии;

определение параметра общей разреженности в соответствии с энергией P коэффициентов энергетического спектра FFT каждого из N аудиокадров содержит:

выбор P1 коэффициентов энергетического спектра FFT из P коэффициентов энергетического спектра FFT каждого из N аудиокадров; и

определение первой пропорции энергии в соответствии с энергией P1 коэффициентов энергетического спектра FFT каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, причем P1 представляет собой положительное целое число меньше P; и

определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, содержит:

когда первая пропорция энергии больше второго заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда первая пропорция энергии меньше второго заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра.

6. Способ по п.5, в котором энергия любой одной из P1 коэффициентов энергетического спектра FFT больше энергии любой одной из других коэффициентов энергетического спектра FFT в P коэффициентов энергетического спектра FFT, за исключением P1 коэффициентов энергетического спектра FFT.

7. Способ по п.2, в котором параметр общей разреженности содержит вторую минимальную ширину полосы и третью минимальную ширину полосы;

определение параметра общей разреженности в соответствии с энергией P коэффициентов энергетического спектра FFT каждого из N аудиокадров содержит:

определение среднего значения минимальных ширин полосы распределения, по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров в соответствии с энергией P коэффициентов энергетического спектра FFT каждого из N аудиокадров, причем минимальная ширина полосы находится из P коэффициентов энергетического спектра FFT таким образом, что пропорция, которую энергия на ширине полосы составляет в полной энергии кадра, представляет собой вторую заранее заданную пропорцию; и

и определение среднего значения минимальных ширин полосы распределения, по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P коэффициентов энергетического спектра FFT каждого из N аудиокадров, причем минимальная ширина полосы находится из P коэффициентов энергетического спектра FFT таким образом, что пропорция, которую энергия на ширине полосы составляет в полной энергии кадра, представляет собой третью заранее заданную пропорцию,

причем среднее значение минимальных ширин полосы распределения, по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров используется в качестве второй минимальной ширины полосы, среднее значение минимальных ширин полосы распределения, по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров используется в качестве третьей минимальной ширины полосы, и вторая заранее заданная пропорция меньше третьей заранее заданной пропорции; и

определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра содержит:

когда вторая минимальная ширина полосы меньше третьего заранее заданного значения и третья минимальная ширина полосы меньше четвертого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра;

когда третья минимальная ширина полосы меньше пятого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или,

когда третья минимальная ширина полосы больше шестого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра, причем

четвертое заранее заданное значение больше или равно третьему заранее заданному значению, пятое заранее заданное значение меньше четвертого заранее заданного значения и шестое заранее заданное значение больше четвертого заранее заданного значения.

8. Способ по п.7, в котором определение среднего значения минимальных ширин полосы распределения, по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определение среднего значения минимальных ширин полосы распределения, по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P коэффициентов энергетического спектра FFT каждого из N аудиокадров содержит:

сортировку энергии P коэффициентов энергетического спектра FFT каждого аудиокадра в убывающем порядке;

определение, в соответствии с энергией, отсортированной в убывающем порядке, P коэффициентов энергетического спектра FFT каждого из N аудиокадров, минимальной ширины полосы распределения, по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров;

определение, в соответствии с минимальной шириной полосы распределения, по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы распределения, по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров;

определение, в соответствии с энергией, отсортированной в убывающем порядке, P коэффициентов энергетического спектра FFT каждого из N аудиокадров, минимальной ширины полосы распределения, по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров; и

определение, в соответствии с минимальной шириной полосы распределения, по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы распределения, по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров.

9. Способ по п.2, в котором параметр общей разреженности содержит вторую пропорцию энергии и третью пропорцию энергии;

определение параметра общей разреженности в соответствии с энергией P коэффициентов энергетического спектра FFT каждого из N аудиокадров содержит:

выбор P2 коэффициентов энергетического спектра FFT из P коэффициентов энергетического спектра FFT каждого из N аудиокадров;

определение второй пропорции энергии в соответствии с энергией P2 коэффициентов энергетического спектра FFT каждого из N аудиокадров и полной энергией соответствующих N аудиокадров;

выбор P3 коэффициентов энергетического спектра FFT из P коэффициентов энергетического спектра FFT каждого из N аудиокадров; и

определение третьей пропорции энергии в соответствии с энергией P3 коэффициентов энергетического спектра FFT каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, причем P2 и P3 представляют собой положительные целые числа меньше P и P2 меньше P3; и

определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, содержит:

когда вторая пропорция энергии больше седьмого заранее заданного значения и третья пропорция энергии больше восьмого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра;

когда вторая пропорция энергии больше девятого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или,

когда третья пропорция энергии меньше десятого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра.

10. Способ по п.9, в котором P2 коэффициентов энергетического спектра FFT представляют собой P2 коэффициентов энергетического спектра FFT, имеющих максимальную энергию в P коэффициентов энергетического спектра FFT; и

P3 коэффициентов энергетического спектра FFT представляют собой P3 коэффициентов энергетического спектра FFT, имеющих максимальную энергию в P коэффициентов энергетического спектра FFT.

11. Способ по п.1, в котором разреженность распределения энергии по спектрам содержит глобальную разреженность, локальную разреженность и кратковременный всплеск распределения энергии по спектрам.

12. Способ по п.11, в котором N равно 1 и N аудиокадров представляют собой текущий аудиокадр; и

определение разреженности распределения, по спектрам, энергии N входных аудиокадров содержит:

деление спектра текущего аудиокадра на Q подполос; и

определение параметра разреженности всплесков в соответствии с пиковой энергией каждой из Q подполос спектра текущего аудиокадра, причем параметр разреженности всплесков используется для указания глобальной разреженности, локальной разреженности и кратковременного всплеска текущего аудиокадра.

13. Способ по п.12, в котором параметр разреженности всплесков содержит: глобальную пропорцию пиковой энергии к средней каждой из Q подполос, локальную пропорцию пиковой энергии к средней каждой из Q подполос и кратковременное отклонение пиковой энергии каждой из Q подполос, причем глобальная пропорция пиковой энергии к средней определяется в соответствии с пиковой энергией в подполосе и средней энергией во всех подполосах текущего аудиокадра, локальная пропорция пиковой энергии к средней определяется в соответствии с пиковой энергией в подполосе и средней энергией в подполосе и кратковременное отклонение пиковой энергии определяется в соответствии с пиковой энергией в подполосе и пиковой энергией в конкретной полосе частот аудиокадра перед этим аудиокадром; и

определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, содержит:

определение, имеется ли первая подполоса в Q подполосах, причем локальная пропорция пиковой энергии к средней первой подполосы больше одиннадцатого заранее заданного значения, глобальная пропорция пиковой энергии к средней первой подполосы больше двенадцатого заранее заданного значения и кратковременное отклонение пиковой энергии первой подполосы больше тринадцатого заранее заданного значения; и,

когда имеется первая подполоса в Q подполосах, определение использования первого способа кодирования для кодирования текущего аудиокадра.

14. Способ по п.1, в котором разреженность распределения энергии по спектрам содержит ограниченные полосой характеристики распределения энергии по спектрам.

15. Способ по п.14, в котором определение разреженности распределения, по спектрам, энергии N входных аудиокадров содержит:

определение разграничительной частоты каждого из N аудиокадров; и

определение параметра ограниченной полосой разреженности в соответствии с разграничительной частотой каждого из N аудиокадров.

16. Способ по п.15, в котором параметр ограниченной полосой разреженности представляет собой среднее значение разграничительных частот N аудиокадров; и

определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, содержит,

когда определяется, что параметр ограниченной полосой разреженности аудиокадров меньше четырнадцатого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра.

17. Устройство кодирования аудио, в котором устройство содержит:

блок получения, выполненный с возможностью получения N аудиокадров, причем N аудиокадров содержат текущий аудиокадр и N представляет собой положительное целое число; и

блок определения, выполненный с возможностью определения разреженности распределения, по спектрам, энергии N аудиокадров, полученных блоком получения, причем разреженность распределения определена для каждого из N входных аудиокадров и

блок определения дополнительно выполнен с возможностью определения, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, причем первый способ кодирования представляет собой способ кодирования, который основывается на частотно-временном преобразовании и квантовании коэффициентов преобразования и который не основывается на линейном предсказании, и второй способ кодирования представляет собой способ кодирования на основе линейного предсказания.

18. Устройство по п.17, в котором

блок определения конкретно выполнен с возможностью деления спектра каждого из N аудиокадров на P коэффициентов энергетического спектра FFT и определения параметра общей разреженности в соответствии с энергией P коэффициентов энергетического спектра FFT каждого из N аудиокадров, причем P представляет собой положительное целое число и параметр общей разреженности указывает разреженность распределения, по спектрам, энергии N аудиокадров.

19. Устройство по п.18, в котором параметр общей разреженности содержит первую минимальную ширину полосы;

блок определения конкретно выполнен с возможностью определения среднего значения минимальных ширин полосы распределения, по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P коэффициентов энергетического спектра FFT каждого из N аудиокадров, причем минимальная ширина полосы находится из P коэффициентов энергетического спектра FFT таким образом, что пропорция, которую энергия на ширине полосы составляет в полной энергии кадра, представляет собой первую заранее заданную пропорцию, причем среднее значение минимальных ширин полосы распределения, по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров представляет собой первую минимальную ширину полосы; и

блок определения конкретно выполнен с возможностью: когда первая минимальная ширина полосы меньше первого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда первая минимальная ширина полосы больше первого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра.

20. Устройство по п.19, в котором блок определения конкретно выполнен с возможностью: сортировки энергии P коэффициентов энергетического спектра FFT каждого аудиокадра в убывающем порядке; определения, в соответствии с энергией, отсортированной в убывающем порядке, P коэффициентов энергетического спектра FFT каждого из N аудиокадров, минимальной ширины полосы распределения, по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров; и определения, в соответствии с минимальной шириной полосы распределения, по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы распределения, по спектрам, энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров.

21. Устройство по п.18, в котором параметр общей разреженности содержит первую пропорцию энергии;

блок определения конкретно выполнен с возможностью выбора P1 коэффициентов энергетического спектра FFT из P коэффициентов энергетического спектра FFT каждого из N аудиокадров и определения первой пропорции энергии в соответствии с энергией P1 коэффициентов энергетического спектра FFT каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, где P1 представляет собой положительное целое число меньше P; и

блок определения конкретно выполнен с возможностью: когда первая пропорция энергии больше второго заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда первая пропорция энергии меньше второго заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра.

22. Устройство по п.21, в котором блок определения конкретно выполнен с возможностью определения P1 коэффициентов энергетического спектра FFT в соответствии с энергией P коэффициентов энергетического спектра FFT, где энергия любой одной из P1 коэффициентов энергетического спектра FFT больше энергии любой одной из других коэффициентов энергетического спектра FFT в P коэффициентов энергетического спектра FFT, за исключением P1 коэффициентов энергетического спектра FFT.

23. Устройство по п.18, в котором параметр общей разреженности содержит вторую минимальную ширину полосы и третью минимальную ширину полосы;

блок определения конкретно выполнен с возможностью определения среднего значения минимальных ширин полосы распределения, по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определения среднего значения минимальных ширин полосы распределения, по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P коэффициентов энергетического спектра FFT каждого из N аудиокадров, причем минимальная ширина полосы находится из P коэффициентов энергетического спектра FFT таким образом, что пропорция, которую энергия на ширине полосы составляет в полной энергии кадра, представляет собой вторую заранее заданную пропорцию или третью заранее заданную пропорцию, причем среднее значение минимальных ширин полосы распределения, по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров используется в качестве второй минимальной ширины полосы, среднее значение минимальных ширин полосы распределения, по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров используется в качестве третьей минимальной ширины полосы и вторая заранее заданная пропорция меньше третьей заранее заданной пропорции; и

блок определения конкретно выполнен с возможностью: когда вторая минимальная ширина полосы меньше третьего заранее заданного значения и третья минимальная ширина полосы меньше четвертого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; когда третья минимальная ширина полосы меньше пятого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда третья минимальная ширина полосы больше шестого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра, причем

четвертое заранее заданное значение больше или равно третьему заранее заданному значению, пятое заранее заданное значение меньше четвертого заранее заданного значения и шестое заранее заданное значение больше четвертого заранее заданного значения.

24. Устройство по п.23, в котором блок определения конкретно выполнен с возможностью: сортировки энергии P коэффициентов энергетического спектра FFT каждого аудиокадра в убывающем порядке; определения, в соответствии с энергией, отсортированной в убывающем порядке, P коэффициентов энергетического спектра FFT каждого из N аудиокадров, минимальной ширины полосы распределения, по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров; определения, в соответствии с минимальной шириной полосы распределения, по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы распределения, по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров; определения, в соответствии с энергией, отсортированной в убывающем порядке, P коэффициентов энергетического спектра FFT каждого из N аудиокадров, минимальной ширины полосы распределения, по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров; и определения, в соответствии с минимальной шириной полосы распределения, по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы распределения, по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров.

25. Устройство по п.18, в котором параметр общей разреженности содержит вторую пропорцию энергии и третью пропорцию энергии;

блок определения конкретно выполнен с возможностью: выбора P2 коэффициентов энергетического спектра FFT из P коэффициентов энергетического спектра FFT каждого из N аудиокадров, определения второй пропорции энергии в соответствии с энергией P2 коэффициентов энергетического спектра FFT каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, выбора P3 коэффициентов энергетического спектра FFT из P коэффициентов энергетического спектра FFT каждого из N аудиокадров и определения третьей пропорции энергии в соответствии с энергией P3 коэффициентов энергетического спектра FFT каждого из N аудиокадров и полной энергий соответствующих N аудиокадров, причем P2 и P3 представляют собой положительные целые числа меньше P и P2 меньше P3; и

блок определения конкретно выполнен с возможностью: когда вторая пропорция энергии больше седьмого заранее заданного значения и третья пропорция энергии больше восьмого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; когда вторая пропорция энергии больше девятого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда третья пропорция энергии меньше десятого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра.

26. Устройство по п.25, в котором блок определения конкретно выполнен с возможностью определения, из P коэффициентов энергетического спектра FFT каждого из N аудиокадров, P2 коэффициентов энергетического спектра FFT, имеющих максимальную энергию, и определения, из P коэффициентов энергетического спектра FFT каждого из N аудиокадров, P3 коэффициентов энергетического спектра FFT, имеющих максимальную энергию.

27. Устройство по п.17, в котором N равно 1 и N аудиокадров представляют собой текущий аудиокадр; и

блок определения конкретно выполнен с возможностью деления спектра текущего аудиокадра на Q подполос и определения параметра разреженности всплесков в соответствии с пиковой энергией каждой из Q подполос спектра текущего аудиокадра, причем параметр разреженности всплесков используется для указания глобальной разреженности, локальной разреженности и кратковременного всплеска текущего аудиокадра.

28. Устройство по п.27, в котором блок определения конкретно выполнен с возможностью определения глобальной пропорции пиковой энергии к средней каждой из Q подполос, локальной пропорции пиковой энергии к средней каждой из Q подполос и кратковременного отклонения пиковой энергии каждой из Q подполос, причем глобальная пропорция пиковой энергии к средней определяется блоком определения в соответствии с пиковой энергией в подполосе и средней энергией во всех подполосах текущего аудиокадра, локальная пропорция пиковой энергии к средней определяется блоком определения в соответствии с пиковой энергией в подполосе и средней энергией в подполосе и кратковременное отклонение пиковой энергии определяется в соответствии с пиковой энергией в подполосе и пиковой энергией в конкретной полосе частот аудиокадра перед этим аудиокадром; и

блок определения конкретно выполнен с возможностью: определения, имеется ли первая подполоса в Q подполосах, причем локальная пропорция пиковой энергии к средней первой подполосы больше одиннадцатого заранее заданного значения, глобальная пропорция пиковой энергии к средней первой подполосы больше двенадцатого заранее заданного значения и кратковременное отклонение пиковой энергии первой подполосы больше тринадцатого заранее заданного значения; и, когда имеется первая подполоса в Q подполосах, определения использования первого способа кодирования для кодирования текущего аудиокадра.

29. Устройство по п.17, в котором блок определения конкретно выполнен с возможностью определения разграничительной частоты каждого из N аудиокадров; и

блок определения конкретно выполнен с возможностью определения параметра ограниченной полосой разреженности в соответствии с разграничительной частотой каждого из N аудиокадров.

30. Устройство по п.29, в котором параметр ограниченной полосой разреженности представляет собой среднее значение разграничительных частот N аудиокадров; и

блок определения конкретно выполнен с возможностью, когда определяется, что параметр ограниченной полосой разреженности аудиокадров меньше четырнадцатого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра.



 

Похожие патенты:

Изобретение относится к обработке аудиосигнала. Технический результат – обеспечение формирования расширенного сигнала из входного сигнала.

Изобретение относится к области обработки аудиосигналов. Технический результат – обеспечение эффективной оценки шума в аудиосигнале.

Изобретение относится к средствам для расширения полосы пропускания аудио посредством вставки шума. Технический результат заключается в повышении эффективности расширения полосы пропускания.

Изобретение относится к средствам для обработки сигнала. Технический результат заключается в повышении качества декодированного сигнала.

Изобретение относится к средствам для оценивания фонового шума в аудиосигнале. Технический результат заключается в повышении точности оценивания, содержит ли аудиосигнал активную речь или музыку или нет.

Изобретение относится к средствам для формирования расширенного сигнала с использованием заполнения независимым шумом. Технический результат заключается в повышении качества кодированного аудиосигнала.

Изобретение относится к области обработки аудиосигналов. Технический результат заключается в повышении эффективности обработки аудиосигналов.

Изобретение относится к кодированию и декодированию и предназначено для осуществления высокочастотной реконструкции аудиосигнала. Технический результат – обеспечение улучшенной реконструкции переходных процессов и тональных компонентов в высокочастотных полосах.

Изобретение относится к средствам стереофонического кодирования и декодирования аудиосигналов. Технический результат заключается в повышении эффективности использования полосы частот.

Изобретение относится к средствам для контекстного энтропийного кодирования выборочных значений спектральной огибающей. Технический результат заключается в повышении эффективности кодирования.

Изобретение относится к средствам для генерации сигнала верхней полосы. Технический результат заключается в повышении эффективности кодирования. Определяют, на устройстве, значение параметра, связанного с расширенным по полосе аудиопотоком. В ответ на то, что параметр имеет первое значение, выбирают информацию фильтра, связанную с расширенным по полосе аудиопотоком. Определяют коэффициенты фильтра на основании информации фильтра. Генерируют, на упомянутом устройстве, сигнал возбуждения верхней полосы на основании информации фильтра, при этом сигнал возбуждения верхней полосы генерируют на основе применения фильтра с упомянутыми коэффициентами фильтра к первому сигналу возбуждения верхней полосы. 4 н. и 26 з.п. ф-лы, 27 ил., 2 табл.
Наверх