Способ преобразования аудиосигнала, устройство и носитель данных

Авторы патента:

У, Сяоцзе (CN)

G10L21/013 - Обработка сигналов речи для получения иного слышимого или неслышимого сигнала, например визуального, осязаемого, для того, чтобы модифицировать их качество или их разборчивость (G10L 19/00 имеет преимущество)

Владельцы патента RU 2770747:

БИГО ТЕКНОЛОДЖИ ПТЕ. ЛТД. (SG)

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в повышении качества аудиосигнала с измененной высотой тона. Технический результат достигается за счет определения аудиосигнала с измененной высотой тона на основании сегментного целевого сигнала частотной области и соотношения первоначальных областей формант и целевой области формант, соответствующей сегментному целевому сигналу частотной области; при этом изменение высоты тона исходного целевого аудиосигнала состоит в регулировке высоты тона аудио, и изменение высоты тона аудиосигнала с измененной высотой тона обеспечивает непротиворечивость характеристик голоса в аудиосигнале до и после изменения высоты тона. 4 н. и 8 з.п. ф-лы, 5 ил.

Ссылка на родственную заявку

[1] Данная заявка представляет собой национальную фазу России международной заявки № PCT/CN2019/121838, поданной 29 ноября 2019 года, которая испрашивает приоритет на основании заявки на патент Китая № 201811628761.6, поданной 28 декабря 2018 года, содержание которой полностью включено в настоящий документ посредством ссылки.

Область техники, к которой относится настоящее изобретение

[2] Настоящее изобретение относится к технической области распознавания голоса, в частности, к способу и устройству для преобразования аудиосигнала, устройству и носителю данных.

Предшествующий уровень техники настоящего изобретения

[3] В условиях стремительного развития Интернет-технологий все более широкое распространение в нашей повседневной жизни получает развлекательное программное обеспечение, которое изменяет высоту тона исходной речи с помощью алгоритма изменения высоты тона. Этот тип программного обеспечения предоставляет пользователям новый способ развлечения и релаксации путем воспроизведения речи с измененной высотой тона. Например, во время модификации первоначальной записи голоса певца может быть изменен тон дефектных звуков с тем, чтобы улучшить звучание песни.

Краткое раскрытие настоящего изобретения

[4] Вариантами осуществления настоящего изобретения предложен способ и устройство для преобразования аудиосигнала, устройство и носитель данных, которые могут осуществлять изменение высоты тона первоначального аудиосигнала, обеспечивая при этом непротиворечивость характеристик голоса в аудиосигналах до и после изменения высоты тона, повышая тем самым качество аудиосигнала с измененной высотой тона.

[5] Одним из вариантов осуществления настоящего изобретения предложен способ преобразования аудиосигнала, предусматривающий:

[6] получение сегментного первоначального сигнала частотной области и сегментного целевого сигнала частотной области и выполнение преобразования Фурье в отношении первоначального аудиосигнала и исходного целевого аудиосигнала, поученного при изменении высоты тона первоначального аудиосигнала.

[7] получение соответствующих первоначальных областей формант путем фильтрации сегментных первоначальных сигналов частотной области на основании первоначальной сегментной функции-окна и получение соответствующей целевой области формант путем фильтрации сегментного целевого сигнала частотной области на основании целевой сегментной функции-окна, причем первоначальная сегментная функция-окно определяется на основании главной частоты и отношения сегментов сегментного первоначального сигнала частотной области, а целевая сегментная функция- окно определяется на основании главной частоты и отношения сегментов сегментного целевого сигнала частотной области; и

[8] определение аудиосигнала с измененной высотой тона на основании сегментного целевого сигнала частотной области и отношения первоначальных областей формант и целевой области формант, соответствующей сегментному целевому сигналу частотной области:

[9] при этом изменение высоты тона исходного целевого аудиосигнала состоит в регулировке высоты тона аудио, и изменение высоты тона аудиосигнала с измененной высотой тона обеспечивает непротиворечивость характеристик голоса в аудиосигнале до и после изменения высоты тона.

[10] Одним из вариантов осуществления настоящего изобретения предложено устройство для преобразования аудиосигнала, включающее в себя:

[11] модуль сегментации и преобразования, выполненный с возможностью получения сегментного первоначального сигнала частотной области и сегментного целевого сигнала частотной области путем соответствующего сегментирования и выполнения преобразования Фурье в отношении первоначального аудиосигнала и исходного целевого аудиосигнала, полученного при изменении высоты тона первоначального аудиосигнала;

[12] модуль определения областей формант, выполненный с возможностью получения соответствующей первоначальной области формант путем фильтрации сегментного первоначального сигнала частотной области на основании первоначальной сегментной функции-окна и получение соответствующей целевой области формант путем фильтрации множества сегментных целевых сигналов частотной области на основании целевой сегментной функции-окна, причем первоначальная сегментная функция-окно определяется на основании главной частоты и длины сегмента сегментного первоначального сигнала частотной области, а целевая сегментная функция-окно определяется на основании главной частоты и длины сегмента сегментного целевого сигнала частотной области; и

[13] модуль определения аудиосигнала с измененной высотой тона, выполненный с возможностью определения аудиосигнала с измененной высотой тона на основании сегментного целевого сигнала частотной области и соотношения первоначальных областей формант и целевой области формант, соответствующей сегментному целевому сигналу частотной области.

[14] при этом изменение высоты тона исходного целевого аудиосигнала состоит в регулировке высоты тона аудио, и изменение высоты тона аудиосигнала с измененной высотой тона обеспечивает непротиворечивость характеристик голоса в аудиосигнале до и после изменения высоты тона.

[15] Одним из вариантов осуществления настоящего изобретения предложено электрическое устройство, включающее в себя:

[16] один или несколько процессоров; и

[17] запоминающее устройство, выполненное с возможностью хранения одной или нескольких программ;

[18] причем при выполнении одной или нескольких программ одним или несколькими процессорами инициируется реализация одним или несколькими процессорами способа преобразования аудиосигнала согласно любому из вариантов осуществления настоящего изобретения.

[19] Одним из вариантов осуществления настоящего изобретения предложен машиночитаемый носитель данных, в котором хранится компьютерная программа; при этом компьютерная программа при ее выполнении процессором инициирует реализацию процессором способа преобразования аудиосигнала согласно любому из вариантов осуществления настоящего изобретения.

Краткое описание фигур

[20] На фиг. 1A показана блок-схема, иллюстрирующая алгоритм реализации способа преобразования аудиосигнала согласно первому варианту осуществления настоящего изобретения;

[21] На фиг. 1B показана блок-схема, иллюстрирующая принцип процесса преобразования аудиосигнала согласно первому варианту осуществления настоящего изобретения;

[22] На фиг. 2 показана блок-схема, иллюстрирующая принципы процесса определения главной частоты и процесса построения функции-окна согласно второму варианту осуществления настоящего изобретения;

[23] На фиг. 3 показана блок-схема, иллюстрирующая принцип процесса преобразования аудиосигнала согласно третьему варианту осуществления настоящего изобретения;

[24] На фиг. 4 показана структурная схема устройства для преобразования аудиосигнала согласно четвертому варианту осуществления настоящего изобретения; и

[25] На фиг. 5 показана структурная схема устройства согласно пятому варианту осуществления настоящего изобретения.

Подробное раскрытие настоящего изобретения

[26] Настоящее изобретение описано ниже в привязке к прилагаемым чертежам и вариантам своего осуществления. Конкретные варианты осуществления заявленного изобретения, описанные в настоящем документе, служат исключительно цели разъяснения, а не ограничения представленного изобретения. Для облегчения описания на прилагаемых чертежах показана лишь часть структуры, относящаяся к настоящему изобретению, а не вся эта структура.

[27] Хотя при обработке первоначальной речи с использованием алгоритма изменения высоты тона цель коррекции высоты тона голоса оказывается достигнутой, характеристики голоса пользователя аудио могут быть изменены, вследствие чего воспроизводимый голос будет существенно отличаться от фактического голоса пользователя аудио. Например, при повышении высоты тона речевого сигнала мужского голоса на четыре полутона этот сигнал будет звучать как девичий голос и характеризоваться определенной погрешностью. Для устранения указанной проблемы, присущей предшествующему уровню техники, обычно используется функция-окно фиксированной длины для обработки кратковременных сигналов преобразования Фурье, соответствующих аудиосигналам до и после изменения высоты тона, с целью получения областей формант, соответствующих аудиосигналам до и после изменения высоты тона; затем на основании полученных областей формант выполняется обработка аудиосигнала с измененной высотой тона для получения в итоге аудиосигнала с измененной высотой тона, в котором устранена погрешность голоса. Однако вследствие фиксированной длины функции-окна для определения областей формант на предшествующем уровне техники установленные области формант будут неточными, что обуславливает несоответствие между характеристиками голоса в полученном в итоге аудиосигнале с измененной высотой тона и характеристиками голоса в аудиосигнале до изменения высоты тона, причем аудиосигнал с измененной высотой тона обладает плохим качеством, а погрешность голоса не может быть устранена

[28] Для обеспечения непротиворечивости характеристик голоса в аудиосигналах до и после изменения высоты тона аудиосигналов настоящее изобретение сфокусировано, главным образом, на обработке данных с целью обеспечения непротиворечивости областей формант в аудиосигналах до и после изменения высоты тона, поскольку форманта отражает распределение энергии аудиосигнала в частотной области и определяет качество аудио, т.е. характеристики голоса. Алгоритм сохранения областей формант используется для устранения влияния целевой области формант с измененной высотой тона на изменение высоты тона, благодаря чему области формант до и после изменения высоты тона остаются такими же, что повышает звуковое качество аудиосигнала с измененной высотой тона.

[29] Первый вариант осуществления

[30] На фиг. 1A показана блок-схема, иллюстрирующая алгоритм реализации способа преобразования аудиосигнала согласно первому варианту осуществления настоящего изобретения. Этот вариант осуществления применим к любому устройству, способному изменять высоту тона аудиосигнала. Технические решения, реализованные в вариантах осуществления настоящего изобретения, пригодны для обеспечения непротиворечивости характеристик голоса в аудиосигналах до и после изменения высоты тона. Способ преобразования аудиосигнала, предложенный этим вариантом осуществления настоящего изобретения, может быть реализован устройством для преобразования аудиосигнала согласно вариантам осуществления настоящего изобретения. Это устройство может быть реализовано в виде программных и/или аппаратных средств, и оно может быть интегрировано в другое устройство для реализации указанного способа. Таким устройством может служить интеллектуальный терминал, в котором предусмотрено приложение, выполненное с возможностью изменения высоты тона аудиосигнала, например, смартфон, планшетный компьютер, карманный компьютер или иное устройство подобного рода.

[31] В одном из вариантов осуществления настоящего изобретения, который проиллюстрирован на фиг. 1A, предложенный способ может предусматривать выполнение стадий, описанных ниже.

[32] На стадии S110 обеспечивается получение первоначального аудиосигнала.

[33] В этом варианте осуществления настоящего изобретения первоначальный аудиосигнал представляет собой аудиосигнал, изначально записанный пользователем аудио с помощью приложения Voice Collector без какой-либо обработки, причем первоначальный аудиосигнал кодируется в виде дискретного сигнала. Первоначальный аудиосигнал содержит большое число точек дискретизации аудио.

[34] В этом варианте осуществления настоящего изобретения предусмотрено, что когда надо изменить высоту тона, сначала необходимо получить первоначальный аудиосигнал, изначально записанный пользователем аудио и снятый с помощью приложения Voice Collector, а затем изменить высоту тона первоначального аудиосигнала.

[35] На стадии S120 обеспечивается получение исходного целевого аудиосигнала путем изменения высоты тона первоначального аудиосигнала.

[36] В этом варианте осуществления настоящего изобретения изменением высоты тона называется коррекция высоты тона аудиосигнала, т.е. регулировка основных частот в аудиосигнале, например, модифицирование некоторых дефектных звуков в первоначальной записи певца, т.е. изменение высоты тона аудиосигнала.

[37] В одном из вариантов осуществления настоящего изобретения предусмотрено, что когда получен первоначальный аудиосигнал и необходимо изменить высоту тона первоначального аудиосигнала, могут быть установлены определенные требования к изменению высоты тона, и на основании этих требований в соответствующей звуковой программе изменения высоты тона могут быть заданы соответствующие параметры изменения высоты тона. Изменение высоты тона проводится в отношении первоначального аудиосигнала в соответствии с заданными параметрами изменения высоты тона с целью получения исходного целевого аудиосигнала. Поскольку во время изменения высоты тона характеристики голоса в первоначальном аудиосигнале нарушаются, характеристики голоса в исходном целевом аудиосигнале также изменяются в сравнении с характеристиками голоса в первоначальном аудиосигнале, и исходный целевой аудиосигнал не может быть выдан напрямую. Необходимо дополнительно восстановить измененные характеристики голоса, гарантируя тем самым, что при воспроизведении итогового аудиосигнала пользователь аудио, записывающий аудиосигнал, будет понятен другим пользователям.

[38] В одном из вариантов осуществления настоящего изобретения получение исходного целевого аудиосигнала путем изменения высоты тона первоначального аудиосигнала может предусматривать: получение амплитуды изменения высоты тона; и получение исходного целевого аудиосигнала путем изменения высоты тона первоначального аудиосигнала на основании амплитуды изменения высоты тона.

[39] В одном из вариантов осуществления настоящего изобретения первоначальный аудиосигнал может быть обработан с использованием алгоритма изменения высоты тона. В этом случае амплитуда изменения высоты тона, соответствующая текущему изменению высоты тона, задается заранее, в результате чего амплитуда изменения высоты тона будет задана в алгоритме изменения высоты тона, а исходный целевой аудиосигнал будет получен путем изменения высоты тона первоначального аудиосигнала на основании амплитуды изменения высоты тона.

[40] На стадии S130 обеспечивается получение множества сегментных первоначальных сигналов частотной области и множества сегментных целевых сигналов частотной области путем соответствующего сегментирования первоначального аудиосигнала и исходного целевого аудиосигнала, а также соответственное выполнение преобразования Фурье в отношении множества сегментных первоначальных аудиосигналов, полученных в результате сегментирования, и множества сегментных целевых аудиосигналов, полученных в результате сегментирования.

[41] В этом варианте осуществления настоящего изобретения преобразование Фурье является способом преобразования сигнала временной области в сигнал частотной области. Информация, которая не может быть явственно получена во временной области, может быть преобразована в частотную область для анализа.

[42] В этом варианте осуществления настоящего изобретения предусмотрено, что поскольку первоначальный аудиосигнал представляет собой аудиосигнал, содержащий разную частотную информацию за определенный период, переданный пользователем аудио, то если преобразование Фурье выполняется напрямую в отношении всего первоначального аудиосигнала, соответственно полученный сигнал частотной области будет представлять собой спектр, соответствующий единичной частоте, определяемой для всей аудиоинформации во всей временной области, что не может отражать соответствующие частотные характеристики в локальных временных областях, и не может быть использовано для выполнения анализа с целью получения информации о частотной области в разные временные периоды. Следовательно, в этом варианте осуществления настоящего изобретения для обработки первоначального аудиосигнала и исходного целевого аудиосигнала с целью получения информации о частотной области, соответствующей первоначальному аудиосигналу и исходному целевому аудиосигналу в разные временные периоды, используется кратковременное преобразование Фурье. Кратковременное преобразование Фурье призвано отобразить характеристику момента в частотной области с использованием сигнала частотной области, соответствующего сегментному аудиосигналу в пределах заданного временного окна.

[43] В этом варианте осуществления настоящего изобретения после получения первоначального аудиосигнала и исходного целевого аудиосигнала для проведения точного анализа информации о частотной области аудиосигнала в данный момент времени, как это показано на фиг. 1B, первоначальный аудиосигнал и исходный целевой аудиосигнал могут быть разбиты на сегменты с целью получения множества сегментных первоначальных аудиосигналов и множества сегментных целевых аудиосигналов. После этого обеспечивается возможность анализа сегментного первоначального аудиосигнала и сегментного целевого аудиосигнала в одном и том же временном сегменте. В отношении множества сегментных первоначальных аудиосигналов и множества сегментных целевых аудиосигналов, которые получены в результате сегментации, для получения множества сегментных первоначальных сигналов частотной области и множества сегментных целевых сигналов частотной области в пределах множества сегментов выполняется преобразование Фурье. При этом, поскольку первоначальный аудиосигнал и исходный целевой аудиосигнал сегментируются с использованием одного и того же метода сегментации, множество сегментных первоначальных сигналов частотной области и множество сегментных целевых сигналов частотной области, полученных после выполнения преобразования Фурье, также находятся во взаимно-однозначном соответствии во множестве сегментов.

[44] На стадии S140 обеспечивается получение множества первоначальных областей формант путем соответствующей фильтрации множества сегментных первоначальных сигналов частотной области на основании множества первоначальных сегментных функций-окон, а также получение множества целевых областей формант путем соответствующей фильтрации множества сегментных целевых сигналов частотной области на основании множества целевых сегментных функций-окон.

[45] В этом варианте осуществления настоящего изобретения первоначальная сегментная функция-окно, соответствующая каждому сегментному первоначальному сигналу частотной области, определяется на основании главной частоты и длины сегмента каждого сегментного первоначального сигнала частотной области, а целевая сегментная функция-окно, соответствующая каждому сегментному целевому сигналу частотной области, определяется на основании главной частоты и длины сегмента каждого сегментного целевого сигнала частотной области. В этом варианте осуществления настоящего изобретения первоначальная сегментная функция-окно и целевая сегментная функция-окно представляют собой адаптивные функции-окна переменной длины. Множество полученных первоначальных сегментных функций-окон характеризуется разной длиной из-за разности главных частот множества сегментных первоначальных сигналов частотной области, и множество полученных целевых сегментных функций-окон также характеризуется разной длиной из-за разности главных частот множества сегментных целевых сигналов частотной области. Вследствие разности колебаний частот в разных сегментах аудиосигнала анализ, выполняемый с использованием функции-окна фиксированной длины, будет приводить к определенным погрешностям. В этом варианте осуществления настоящего изобретения адаптивные функции-окна переменной длины используются для обработки аудиосигналов до и после изменения высоты тона в разных сегментах, что позволяет уменьшить погрешности обработки. В этом варианте осуществления настоящего изобретения главной частотой сегментного первоначального аудиосигнала называется основанная частота, входящая в сегментный первоначальный аудиосигнал, которая может быть отражена в сегментном первоначальном сигнале частотной области; главной частотой сегментного целевого сигнала частотной области называется основанная частота, входящая в сегментный целевой сигнал частотной области, которая может быть отражена в сегментном целевом сигнале частотной области; а длина сегмента обозначает количество точек дискретизации, которые должны находиться в пределах каждого сегмента аудиосигнала, и обычно она составляет величину 2n; к примеру, длина сегмента может быть равна 1024, 2048 и т.п.

[46] В одном из вариантов осуществления настоящего изобретения форманта представляет собой область сигнала частотной области, где наблюдается относительная концентрация акустической энергии, которая определяет качество речи. Форманта сигнала может быть использована для определения пользователя аудио, который передает аудиосигнал. Областью формант называется интервал частотной области, который образуется путем соединения точек с наивысшей амплитудой, соответствующих разным частотам в сигнале частотной области, и который может отображать характеристики голоса пользователя аудио в текущем сегменте.

[47] В одном из вариантов осуществления настоящего изобретения для повышения скорости обработки сигнала во время определения главной частоты сегментного целевого сигнала частотной области предусмотрено, что поскольку изменение высоты тона сигнала заключается в регулировке частоты сигнала, главная частота сегментного целевого сигнала частотной области в пределах сегмента может быть определена напрямую на основании главной частоты сегментного первоначального сигнала частотной области в пределах этого сегмента и амплитуды изменения высоты тона. При этом отсутствует необходимость в повторном определении главных частот множества сегментных целевых сигналов частотной области, что сокращает число дополнительных операций детектирования и повышает скорость обработки сигналов.

[48] В одном из вариантов осуществления настоящего изобретения предусмотрено, что при получении сегментных первоначальных сигналов частотной области и сегментных исходных сигналов частотной области сначала может быть детектирована главная частота каждого сегментного первоначального сигнала частотной области, и на основании главной частоты и длины сегмента сегментного первоначального сигнала частотной области определяется соответствующая первоначальная сегментная функция-окно. При этом предусмотрена обработка только сегментного первоначального сигнала частотной области в пределах соответствующего сегмента на основании первоначальной сегментной функции-окна, тогда как прочие сегментные первоначальные сигналы частотной области не обрабатываются. Разные сегментные первоначальные сигналы частной области соответствуют разным первоначальным сегментным функциям- окнам вследствие того, что разные сегментные первоначальные сигналы частной области характеризуются разными главными частотами. Для сегментных целевых сигналов частной области множество целевых сегментных функций-окон, соответствующих множеству сегментных целевых сигналов частной области, определяется таким же образом на основании главных частот и длины сегментов во множестве сегментных целевых сигналов частотной области.

[49] В одном из вариантов осуществления настоящего изобретения множество сегментных первоначальных сигналов частотной области фильтруется с использованием множества первоначальных сегментных функций-окон, соответствующих множеству сегментных первоначальных сигналов частотной области, вследствие чего обеспечивается получение множества первоначальных областей формант, соответствующих множеству сегментных первоначальных сигналов частотной области. При этом множество сегментных первоначальных сигналов частотной области фильтруется с использованием целевых сегментных функций-окон, соответствующих множеству сегментных целевых сигналов частотной области, вследствие чего обеспечивается получение множества целевых областей формант, соответствующих множеству сегментных целевых сигналов частотной области. Количество первоначальных областей формант и количество целевых областей формант соответствует количеству сегментов.

[50] Функции-окна в этом варианте осуществления настоящего изобретения могут трактоваться как фильтры нижних частот в разных формах при фильтрации сигналов частотной области, причем адаптивная переменная длина используемой функции-окна может приводить к варьированию характеристик низкочастотной фильтрации с изменением характеристик сигнала частотной области.

[51] На стадии S150 определяется аудиосигнал с измененной высотой тона на основании множества сегментных целевых сигналов частотной области, множества первоначальных областей формант и множества целевых областей формант.

[52] В этом варианте осуществления настоящего изобретения аудиосигнал с измененной высотой тона представляет собой выданный в итоге аудиосигнал, который был получен путем изменения высоты тона первоначального аудиосигнала, и влияние которого на характеристики голоса вследствие изменения высоты тона было устранено, причем аудиосигнал с измененной высотой тона имеет характеристики голоса, согласующиеся с характеристиками голоса первоначального аудиосигнала.

[53] После получения множества первоначальных областей формант и множества целевых областей формант для обеспечения непротиворечивости характеристик голоса в аудиосигналах до и после изменения высоты тона необходимо устранить влияние целевых формант во множестве сегментных целевых сигналов частотной области после изменения высоты тона. В одном из вариантов осуществления настоящего изобретения определяется отношение первоначальной области формант к целевой области формант для отображения изменения характеристик голоса в сегментном первоначальном сигнале частотной области до изменения высоты тона и в сегментом целевом сигнале частотной области после изменения высоты тона в пределах сегмента. Затем определяется итоговый соответствующий сегментный сигнал частотной области в пределах сегмента на основании сегментного целевого сигнала частотной области в пределах сегмента и указанного отношения. И, наконец, определяются сегментные сигналы частотной области в пределах множества сегментов на основании множества сегментных целевых сигналов частотной области в пределах множества сегментов и множества соответствующий отношений. На основании множества сегментных сигналов частотной области обеспечивается получение итогового сигнала частотной области с измененной высотой тона, в результате чего определяется итоговый аудиосигнал с измененной высотой тона.

[54] Согласно техническому решению, реализованному в этом варианте осуществления настоящего изобретения, обеспечивается получение множества сегментных первоначальных сигналов частотной области и множества сегментных целевых сигналов частотной области путем сегментирования первоначального аудиосигнала и исходного целевого аудиосигнала, и в отношении множества сегментных первоначальных аудиосигналов, полученных в результате сегментирования, и множества сегментных целевых аудиосигналов, полученных в результате сегментирования, соответствующим образом выполняется преобразование Фурье. На основании главных частот и длины сегментов множества сегментных первоначальных сигналов частотной области определяется множество первоначальных сегментных функций-окон, а на основании главных частот и длины сегментов множества сегментных целевых сигналов частотной области определяется множество целевых сегментных функций-окон. Разные сегментные сигналы могут соответствовать разным сегментным функциям-окнам. Затем обеспечивается получение множества первоначальных областей формант и множества целевых областей формант путем соответствующей фильтрации множества сегментных первоначальных сигналов частотной области и множества сегментных целевых сигналов частотной области на основании множества первоначальных сегментных функций-окон и множества целевых сегментных функций-окон. Таким образом, уменьшаются погрешности при получении областей формант до и после изменения высоты тона. Затем определяется итоговый аудиосигнал с измененной высотой тона на основании множества сегментных целевых сигналов частотной области и множества областей формант до и после изменения высоты тона. При этом устраняется влияние целевых областей формант на изменение высоты тона, благодаря чему аудиосигналы до и после изменения высоты тона характеризуются одинаковыми областями формант, что обеспечивает непротиворечивость характеристик голоса в аудиосигналах до и после изменения высоты тона, а также повышает звуковое качество аудиосигнала с измененной высотой тона.

[55] Второй вариант осуществления

[56] На фиг. 2 показана блок-схема, иллюстрирующая принципы процесса определения главной частоты и процесса построения функции-окна согласно второму варианту осуществления настоящего изобретения. Этот вариант осуществления описан в привязке к предыдущему варианту осуществления настоящего изобретения. Этот вариант осуществления раскрывает, главным образом, процесс детектирования главных частот множества сегментных первоначальных сигналов частотной области, получаемых путем выполнения преобразования Фурье после сегментирования первоначального аудиосигнала, а также процесс построения множества первоначальных сегментных функций-окон, соответствующих множеству сегментных первоначальных сигналов частотной области, и множества целевых сегментных функций-окон, соответствующих множеству сегментных целевых сигналов частотной области.

[57] Способ согласно этому варианту осуществления настоящего изобретения может предусматривать выполнение стадий, описанных ниже.

[58] На стадии S2010 обеспечивается получение первоначального аудиосигнала.

[59] На стадии S2020 обеспечивается получение исходного целевого аудиосигнала путем изменения высоты тона первоначального аудиосигнала. На стадии S2030 обеспечивается получение множества сегментных первоначальных сигналов частотной области и множества сегментных целевых сигналов частотной области путем соответствующего сегментирования первоначального аудиосигнала и исходного целевого аудиосигнала, и соответственно выполняется преобразование Фурье в отношении множества сегментных первоначальных аудиосигналов, полученных в результате сегментирования, и множества сегментных целевых аудиосигналов, полученных в результате сегментирования.

[60] На стадии S2040 определяется, несет ли каждый сегментный первоначальный сигнал частотной области из числа множества сегментных первоначальных сигналов частотной области главную частоту; если сегментный первоначальный сигнал частотной области несет главную частоту, то выполняется стадия S2050; а если сегментный первоначальный сигнал частотной области не несет главную частоту, то выполняется стадия S2060.

[61] В одном из вариантов осуществления настоящего изобретения сегментные первоначальные сигналы частотной области и сегментные целевые сигналы частотной области должны фильтроваться с последовательным использованием функций-окон для определения соответствующих областей формант. Следовательно, в этом варианте осуществления настоящего изобретения для повышения точности областей формант сигналов частотной области в разных сегментах до и после изменения высоты тона необходимо отфильтровать разные сигналы частотной области с использованием адаптивных функций-окон переменной длины. В данном случае функции-окна, соответственно используемые в отношении множества сигналов частотной области, могут быть определены на основании главных частот и длины сегментов разных сигналов частотной области. Следовательно, в этом варианте осуществления настоящего изобретения сначала должны быть детектированы главные частоты сегментных первоначальных сигналов частотной области. В данном случае определяется, несет ли каждый сегментный первоначальный сигнал частотной области из числа множества сегментных первоначальных сигналов частотной области главную частоту. В этом варианте осуществления настоящего изобретения для последующего анализа эффективности результата детектирования главной частоты результат определения того, несет ли текущий сегментный первоначальный сигнал частотной области главную частоту, может быть маркирован. Если текущий сегментный первоначальный сигнал частотной области несет главную частоту, то маркируется фактический результат по главной частоте. Если текущий сегментный первоначальный сигнал частотной области не несет главную частоту, то используется заданный флажок для маркировки текущего сегментного первоначального сигнала частотной области с тем, чтобы впоследствии можно было четко определить сегментный первоначальный сигнал частотной области, который не несет главную частоту.

[62] На стадии S2050 переносимая главная частота используется в качестве главной частоты каждого сегментного первоначального сигнала частотной области.

[63] В одном из вариантов осуществления настоящего изобретения

предусмотрено, что если текущий сегментный первоначальный сигнал частотной области несет главную частоту, то переносимая главная частота напрямую используется в качестве главной частоты текущего сегментного первоначального сигнала частотной области.

[64] На стадии S260 определяется главная частота каждого сегментного первоначального сигнала частотной области на основании главной частоты предыдущего сегментного первоначального сигнала частотной области относительно каждого сегментного первоначального сигнала частотной области и главной частоты последующего сегментного первоначального сигнала частотной области относительно каждого сегментного первоначального сигнала частотной области.

[65] В одном из вариантов осуществления настоящего изобретения детектирование главной частоты может не дать результата вследствие наличия сглаженной или слабой части сигнала в первоначальном аудиосигнале. Следовательно, после сегментирования и выполнения преобразования Фурье в отношении

первоначального аудиосигнала сегментный первоначальный сигнал частотной области, соответствующий сглаженной или слабой части сигнала, может не нести главную частоту. В этом варианте осуществления настоящего изобретения предусмотрено, что если текущий сегментный первоначальный сигнал частотной области не несет главную частоту, то для сглаживания результата детектирования главной частоты главная частота текущего сегментного первоначального сигнала частотной области определяется на основании главной частоты предыдущего сегментного первоначального сигнала частотной области и главной частоты последующего сегментного первоначального сигнала частотной области.

[66] В одном из вариантов осуществления настоящего изобретения определение

главной частоты каждого сегментного первоначального сигнала частотной области на основании главной частоты предыдущего сегментного первоначального сигнала

частотной области относительно каждого сегментного первоначального сигнала

частотной области и главной частоты последующего сегментного первоначального сигнала частотной области относительно каждого сегментного первоначального сигнала частотной области может предусматривать: вычисление - с использованием

интерполяционного алгоритма - главной частоты предыдущего сегментного первоначального сигнала частотной области относительно каждого сегментного первоначального сигнала частотной области и главной частоты последующего сегментного первоначального сигнала частотной области относительно каждого сегментного первоначального сигнала частотной области с целью получения главной частоты каждого сегментного первоначального сигнала частотной области.

[67] В одном из вариантов осуществления настоящего изобретения интерполяционный алгоритм может быть использован для вычисления главной частоты предыдущего сегментного первоначального сигнала частотной области и главной частоты последующего сегментного первоначального сигнала частотной области относительно текущего сегментного первоначального сигнала частотной области с целью получения главной частоты текущего сегментного первоначального сигнала частотной области.

[68] На стадии S2070 определяется главная частота каждого сегментного целевого сигнала частотной области на основании произведения главной частоты каждого сегментного первоначального сигнала частотной области и амплитуды изменения высоты тона.

[69] На стадии S2080 обеспечивается получение первоначальной длины окна, соответствующей каждому сегментному первоначальному сигналу частотной области, на основании главной частоты и длины сегмента каждого сегментного первоначального сигнала частотной области; и обеспечивается построение первоначальной сегментной функции-окна, соответствующей каждому сегментному первоначальному сигналу частотной области, на основании первоначальной длины окна и заданного типа окна, соответствующего каждому сегментному первоначальному сигналу частотной области.

[70] В этом варианте осуществления настоящего изобретения после получения главных частот множества сегментных первоначальных сигналов частотной области могут быть определены первоначальные значения длины используемых функций-окон в пределах множества сегментов на основании главных частот и значений длины сегментов множества сегментных первоначальных сигналов частотной области. Например, первоначальная длина окна может быть определена следующим образом: Ln_s=Pn*N/Fs, где величина Ln_s обозначает первоначальную длину окна; величина Pn обозначает главную частоту сегментного первоначального сигнала частотной области; величина N обозначает длину сегмента, т.е. количество точек дискретизации в пределах каждого сегмента; а величина Fs обозначает частоту дискретизации первоначального аудиосигнала, которая обычно составляет 48 кГ ц.

[71] В одном из вариантов осуществления настоящего изобретения заданные типы окон относятся к разным типам функций-окон, которые могут представлять собой треугольное окно, прямоугольное окно, окно Хеннинга или иное окно подобного рода, что не носит ограничительного характера в этом варианте осуществления настоящего изобретения. Множество первоначальных сегментных функций-окон, соответствующее множеству сегментных первоначальных сигналов частотной области, может быть построено на основании первоначальных значений длины окон и заданных типов окон, соответствующих множеству сегментных первоначальных сигналов частотной области, после чего обеспечивается фильтрация соответствующих сегментных первоначальных сигналов частотной области с использованием - соответствующим образом - множества первоначальных сегментных функций-окон.

[72] На стадии S2090 обеспечивается получение целевой длины окна,

соответствующей каждому сегментному целевому сигналу частотной области на основании главной частоты и длины сегмента сегментного целевого сигнала частотной области; и обеспечивается построение целевой сегментной функции-окна, соответствующей каждому сегментному целевому сигналу частотной области на

основании целевой длины окна и заданного типа окна, соответствующего каждому сегментному целевому сигналу частотной области.

[73] В этом варианте осуществления настоящего изобретения после получения главных частот множества сегментных целевых сигналов частотной области на основании главных частот множества сегментных первоначальных сигналов частотной области и амплитуды изменения высоты тона может быть определена целевая длина функции-окна, используемого в каждом сегменте, на основании главной частоты и длины сегмента каждого сегментного целевого сигнала частотной области. К примеру, целевая длина окна может быть определена следующим образом: Ln_s=Pn*Ratio*N/Fs, где величина Ln_s обозначает длину окна; величина Pn обозначает главную частоту сегментного первоначального сигнала частотной области; величина Ratio обозначает амплитуду изменения высоты тона; величина N обозначает длину сегмента, т.е. количество точек дискретизации в пределах каждого сегмента; а величина Fs обозначает частоту дискретизации исходного целевого аудиосигнала, которая обычно составляет 48 кГ ц.

[74] В одном из вариантов осуществления настоящего изобретения может быть обеспечено построение множества целевых сегментных функций-окон, соответствующих множеству сегментных целевых сигналов частотной области, на основании целевых значений длины окон и заданных типов окон, соответствующих множеству сегментных целевых сигналов частотной области, после чего выполняется фильтрация множества соответствующих сегментных целевых сигналов частотной области с использованием - соответствующим образом - множества целевых сегментных функций-окон.

[75] Стадии S2080 и S2090 не обязательно должны выполняться в строго заданном порядке, а они могут выполняться одновременно, что не носит ограничительного характера в этом варианте осуществления настоящего изобретения.

[76] На стадии S2100 обеспечивается получение множества первоначальных областей формант путем соответствующей фильтрации множества сегментных первоначальных сигналов частотной области на основании множества первоначальных сегментных функций-окон и получение множества целевых областей формант путем соответствующей фильтрации множества сегментных целевых сигналов частотной области на основании множества целевых сегментных функций-окон.

[77] На стадии S2110 определяется аудиосигнал с измененной высотой тона на основании множества сегментных целевых сигналов частотной области, множества первоначальных областей формант и множества целевых областей формант.

[78] Согласно техническому решению, реализованному в этом варианте осуществления настоящего изобретения, обеспечивается определение главных частот множества сегментных первоначальных сигналов частотной области и множества сегментных целевых сигналов частотной области; соответственно определяется множество соответствующих первоначальных значений длины окон во множестве сегментов на основании главных частот и значений длины окон множества сегментных первоначальных сигналов частотной области во множестве сегментов, и соответственно определяется множество соответствующих целевых значений длины окон во множестве сегментов на основании главных частот и значений длины окон множества сегментных целевых сигналов частотной области во множестве сегментов. Строятся адаптивные функции-окна переменной длины. Обеспечивается получение множества первоначальных областей формант и множества целевых областей формант путем фильтрации множества сегментных первоначальных сигналов частотной области и множества сегментных целевых сигналов частотной области. Таким образом, уменьшаются погрешности при получении областей формант до и после изменения высоты тона. Сообразно областям формант до и после изменения высоты тона устраняется влияние целевых областей формант на изменение высоты тона, так что аудиосигналы до и после изменения высоты тона характеризуются одинаковыми областями формант, что обеспечивает непротиворечивость характеристик голоса в аудиосигналах до и после изменения высоты тона, а также повышает звуковое качество аудиосигнала с измененной высотой тона.

[79] Третий вариант осуществления

[80] На фиг. 3 показана блок-схема, иллюстрирующая принцип процесса преобразования аудиосигнала согласно третьему варианту осуществления настоящего изобретения. Этот вариант осуществления настоящего изобретения описан в привязке к вариантам осуществления, раскрытым выше. Этот вариант осуществления описывает процесс выполнения сегментирования и преобразования Фурье в отношении аудиосигнала и процесс определения аудиосигнала с измененной высотой тона.

[81] Этот вариант осуществления настоящего изобретения может предусматривать выполнение стадий, описанных ниже.

[82] На стадии S310 обеспечивается получение первоначального аудиосигнала.

[83] На стадии S320 обеспечивается получение исходного целевого аудиосигнала путем изменения высоты тона первоначального аудиосигнала.

[84] На стадии S330 обеспечивается получение множества сегментных первоначальных аудиосигналов и множества сегментных целевых аудиосигналов путем сегментирования первоначального аудиосигнала и исходного целевого аудиосигнала на основании заданной длины сегмента и смещения сегмента.

[85] В одном из вариантов осуществления настоящего изобретения во время сегментирования первоначального аудиосигнала и исходного целевого аудиосигнала согласно этому варианту осуществления настоящего изобретения сначала должна была определена заданная длина сегмента и смещение сегмента, соответствующее текущему сегментированию. Заданная длина сегмента обозначает количество точек дискретизации, которые должны находиться в пределах каждого сегмента аудиосигнала, и обычно она составляет величину 2n. Например, заданная длина сегмента может быть равна 1024, 2048 и т.п. Смещение сегмента указывает на расстояние между начальными точками дискретизации соседних сегментов. Если заданная длина сегмента равна 1024, а смещение сегмента равно 512, то первый сегмент будет состоять из точек дискретизации 1-1024, а второй сегмент будет состоять из точек дискретизации 513-1536. В этом варианте осуществления настоящего изобретения получение множества сегментных первоначальных аудиосигналов и множества сегментных целевых аудиосигналов в пределах множества сегментов обеспечивается путем сегментирования первоначального аудиосигнала и исходного целевого аудиосигнала на основании заданной длины сегмента и смещения сегмента.

[86] На стадии S340 обеспечивается получение множества сегментных первоначальных сигналов частотной области и множества сегментных целевых сигналов частотной области путем соответствующего выполнения преобразования Фурье в отношении множества сегментных первоначальных аудиосигналов и множества сегментных целевых аудиосигналов.

[87] В одном из вариантов осуществления настоящего изобретения предусмотрено, что после получения множества сегментных первоначальных аудиосигналов и множества сегментных целевых аудиосигналов может быть выполнено преобразование Фурье в отношении множества сегментных первоначальных аудиосигналов и множества сегментных целевых аудиосигналов в пределах множества сегментов с целью получения множества сегментных первоначальных сигналов частотной области и множества сегментных целевых сигналов частотной области, соответствующих множеству сегментов.

[88] На стадии S350 обеспечивается получение множества первоначальных областей формант путем соответствующей фильтрации множества сегментных первоначальных сигналов частотной области на основании множества первоначальных сегментных функций-окон, а также получение множества целевых областей формант путем соответствующей фильтрации множества сегментных целевых сигналов частотной области на основании множества целевых сегментных функций-окон, причем первоначальная сегментная функция-окно, соответствующая каждому сегментному первоначальному сигналу частотной области, определяется на основании главной частоты и длины сегмента каждого сегментного первоначального сигнала частотной области, а целевая сегментная функция-окно, соответствующая каждому сегментному целевому сигналу частотной области, определяется на основании главной частоты и длины сегмента каждого сегментного целевого сигнала частотной области.

[89] На стадии S360 определяется отношение изменения высоты тона,

соответствующее каждому сегментному целевому сигналу частотной области, на

основании первоначальной области формант и целевой области формант, соответствующей каждому сегментному целевому сигналу частотной области.

[90] В одном из вариантов осуществления настоящего изобретения

предусмотрено, что после получения первоначальной области формант, соответствующей каждому сегментному первоначальному сигналу частотной области, и целевой области формант, соответствующей каждому сегментному целевому сигналу частотной области, для единичного сегментного целевого сигнала частотной области может быть

предусмотрено сравнение друг с другом первоначальной области формант и целевой области формант в сегменте, соответствующем сегментному целевому сигналу частотной области, с целью определения отношения изменения высоты тона, соответствующего сегментному целевому сигналу частотной области, причем отношение изменения высоты тона отражает влияние целевой области формант с измененной высотой тона на характеристики голоса в процессе изменения высоты тона. Используя этот же способ, можно определить множество отношений изменения высоты тона, соответствующих множеству сегментных целевых сигналов частотной области.

[91] На стадии S370 определяется сегментный сигнал частотной области с измененной высотой тона, соответствующий каждому сегментному целевому сигналу частотной области, на основании каждого сегментного целевого сигнала частотной области и отношения изменения высоты тона, соответствующего каждому сегментному целевому сигналу частотной области.

[92] В этом варианте осуществления настоящего изобретения для устранения влияния целевой области формант на характеристики голоса в процессе изменения высоты тона сегментный целевой сигнал частотной области и отношение изменения высоты тона, соответствующее целевой области формант, могут быть помножены с целью получения сегментного сигнала частотной области с измененной высотой тона, соответствующего сегменту, за счет чего устраняется влияние изменения высоты тона. Сегментный сигнал частотной области с измененной высотой тона характеризуется такой же областью формант, что и сегментный первоначальный сигнал частотной области в пределах того же сегмента. Используя этот же способ, можно определить множество сегментных сигналов частотной области с измененной высотой тона, соответствующих множеству сегментов, за счет чего устраняется влияние изменения высоты тона. В этом варианте осуществления настоящего изобретения получение соответствующего сегментного сигнала частотной области с измененной высотой тона обеспечивается по следующей формуле: STFT_tn'=STFT_tn*Esn/Etn, где величина STFT_tn' обозначает сегментный сигнал частотной области с измененной высотой тона; величина STFT_tn обозначает сегментный целевой сигнал частотной области; величина Esn обозначает соответствующую первоначальную область формант в сегменте; а величина Etn обозначает соответствующую целевую область формант в сегменте.

[93] На стадии S380 обеспечивается получение сегментного аудиосигнала с измененной высотой тона, соответствующего каждому сегментному целевому сигналу частотной области, путем выполнения обратного преобразования Фурье в отношении сегментного сигнала частотной области с измененной высотой тона, соответствующего каждому сегментному целевому сигналу частотной области.

[94] В одном из вариантов осуществления настоящего изобретения предусмотрено, что после получения соответствующего сегментного сигнала частотной области с измененной высотой тона в пределах каждого сегмента может быть выполнено обратное преобразование Фурье в отношении соответствующего сегментного сигнала частотной области с измененной высотой тона в пределах каждого сегмента с целью получения сегментного аудиосигнала с измененной высотой тона в пределах каждого сегмента, после чего определяется итоговый аудиосигнал с измененной высотой тона на основании множества сегментных аудиосигналов с измененной высотой тона.

[95] На стадии S390 определяется аудиосигнал с измененной высотой тона на основании множества сегментных аудиосигналов с измененной высотой тона, заданной длины сегмента и смещения сегмента.

[96] В одном из вариантов осуществления настоящего изобретения после получения множества сегментных аудиосигналов с измененной высотой тона это множество сегментных аудиосигналов с измененной высотой тона может быть составлено на основании заданной длины окна и смещения сегмента во время сегментирования первоначального аудиосигнала с целью получения итогового аудиосигнала с измененной высотой тона, за счет чего влияние целевых областей формант на характеристики голоса в процессе изменения высоты тона было устранено. Аудиосигнал с измененной высотой тона характеризуется такими же областями формант, что и первоначальный аудиосигнал, что обеспечивает непротиворечивость характеристик голоса в аудиосигналах до и после изменения высоты тона.

[97] Согласно техническому решению, реализованному в этом варианте осуществления настоящего изобретения, для единичного сегментного целевого сигнала частотной области соответствующее отношение изменения высоты тона определяется на основании области формант до изменения высоты тона и области формант после изменения высоты тона, а соответствующий сегментный сигнал частотной области с измененной высотой тона определяется на основании сегментного целевого сигнала частотной области в пределах сегмента и отношения изменения высоты тона, что устраняет влияние области формант в пределах сегмента на изменение высоты тона. Таким образом, обеспечивается получение множества сегментных сигналов частотной области с измененной высотой тона, за счет которых устраняется влияние областей формант, в пределах множества сегментов, а также обеспечивается получение множества сегментных аудиосигналов с измененной частотой тона с использованием обратного преобразования Фурье. Соответствующий аудиосигнал с измененной высотой тона образуется множеством сегментных аудиосигналов с измененной высотой тона, что обеспечивает непротиворечивость характеристик голоса в аудиосигналах до и после изменения высоты тона и повышает звуковое качество аудиосигнала с измененной высотой тона.

[98] Четвертый вариант осуществления

[99] На фиг. 4 показана структурная схема устройства для преобразования аудиосигнала согласно четвертому варианту осуществления настоящего изобретения. Как показано на фиг. 4, это устройство может включать в себя: модуль 410 сегментации и преобразования, выполненный с возможностью получения множества сегментных первоначальных сигналов частотной области и множества сегментных целевых сигналов частотной области путем сегментирования первоначального аудиосигнала и исходного целевого аудиосигнала, полученного при изменении высоты тона первоначального аудиосигнала, и выполнения преобразования Фурье в отношении множества сегментных первоначальных аудиосигналов, полученных в результате сегментирования, и множества сегментных целевых аудиосигналов, полученных в результате сегментирования; модуль 420 определения областей формант, выполненный с возможностью получения множества первоначальных областей формант путем соответствующей фильтрации множества сегментных первоначальных сигналов частотной области на основании множества первоначальных сегментных функций-окон и получения множества целевых областей формант путем соответствующей фильтрации множества сегментных целевых сигналов частотной области на основании множества целевых сегментных функций-окон, причем первоначальная сегментная функция-окно, соответствующая каждому сегментному первоначальному сигналу частотной области, определяется на основании главной частоты и длины сегмента каждого сегментного первоначального сигнала частотной области, а целевая сегментная функция-окно, соответствующая каждому сегментному целевому сигналу частотной области, определяется на основании главной частоты и длины сегмента каждого сегментного целевого сигнала частотной области; и модуль 430 определения аудиосигнала с измененной высотой тона, выполненный с возможностью определения аудиосигнала с измененной высотой тона на основании множества сегментных целевых сигналов частотной области, множества первоначальных областей формант и множества целевых областей формант.

[100] Согласно техническому решению, реализованному в этом варианте осуществления настоящего изобретения, обеспечивается получение множества сегментных первоначальных сигналов частотной области и множества сегментных целевых сигналов частотной области путем сегментирования первоначального аудиосигнала и исходного целевого аудиосигнала, полученного при изменении высоты тона первоначального аудиосигнала, и выполнение преобразования Фурье в отношении множества сегментных первоначальных аудиосигналов, полученных в результате сегментирования, и множества целевых аудиосигналов, полученных в результате сегментирования. На основании главных частот и длины сегментов множества сегментных первоначальных сигналов частотной области определяется множество первоначальных сегментных функций-окон, а на основании главных частот и длины сегментов множества сегментных целевых сигналов частотной области определяется множество целевых сегментных функций-окон. Разные сегменты сигналов могут соответствовать разным сегментным функциям-окнам. Затем обеспечивается получение множества первоначальных областей формант и множества целевых областей формант путем соответствующей фильтрации множества сегментных первоначальных сигналов частотной области и множества сегментных целевых сигналов частотной области на основании множества первоначальных сегментных функций-окон и множества целевых сегментных функций-окон. Таким образом, уменьшаются погрешности при получении областей формант до и после изменения высоты тона. Затем определяется итоговый аудиосигнал с измененной высотой тона на основании множества сегментных целевых сигналов частотной области и множества областей формант до и после изменения высоты тона. При этом устраняется влияние целевых областей формант на изменение высоты тона, благодаря чему аудиосигналы до и после изменения высоты тона характеризуются одинаковыми областями формант, что обеспечивает непротиворечивость характеристик голоса в аудиосигналах до и после изменения высоты тона, а также повышает звуковое качество аудиосигнала с измененной высотой тона.

[101] Пятый вариант осуществления

[102] На фиг. 5 показана структурная схема устройства согласно пятому варианту осуществления настоящего изобретения. Как показано на фиг. 5, это устройство включает в себя процессор 50, запоминающее устройство 51 и устройство 52 связи.

[103] Запоминающее устройство 51, представленное в виде машиночитаемого носителя данных, может быть выполнено с возможностью хранения программных продуктов, исполняемых компьютером программ и модулей, таких как программные команды/модули, соответствующие способу преобразования аудиосигнала, описанному согласно любом из вариантов осуществления настоящего изобретения. Процессор 50 приводит в исполнение программные продукты, команды и модули, хранящиеся в запоминающем устройстве 51, с целью выполнения различных функциональных приложений устройства и обработки данных, т.е. для реализации способа преобразования аудиосигнала, описанного выше.

[104] Шестой вариант осуществления

[105] Этим вариантом осуществления настоящего изобретения дополнительно предложен энергонезависимый машиночитаемый носитель данных, в котором хранится компьютерная программа; при этом компьютерная программа при ее выполнении процессором может реализовать способ преобразования аудиосигнала согласно любому из вариантов осуществления настоящего изобретения. Этот способ может, в частности, предусматривать: получение множества сегментных первоначальных сигналов частотной области и множества сегментных целевых сигналов частотной области путем сегментирования первоначального аудиосигнала и исходного целевого аудиосигнала, полученного при изменении высоты тона первоначального аудиосигнала, и выполнение преобразования Фурье в отношении множества сегментных первоначальных аудиосигналов, полученных в результате сегментирования, и множества сегментных целевых аудиосигналов, полученных в результате сегментирования; получение множества первоначальных областей формант путем соответствующей фильтрации множества сегментных первоначальных сигналов частотной области на основании множества первоначальных сегментных функций-окон и получение множества целевых областей формант путем соответствующей фильтрации множества сегментных целевых сигналов частотной области на основании множества целевых сегментных функций-окон, причем первоначальная сегментная функция-окно, соответствующая каждому сегментному первоначальному сигналу частотной области, определяется на основании главной частоты и длины сегмента каждого сегментного первоначального сигнала частотной области, а целевая сегментная функция-окно, соответствующая каждому сегментному целевому сигналу частотной области, определяется на основании главной частоты и длины сегмента каждого сегментного целевого сигнала частотной области; и определение аудиосигнала с измененной высотой тона на основании множества сегментных целевых сигналов частотной области, множества первоначальных областей формант и множества целевых областей формант.

1. Способ преобразования аудиосигнала, предусматривающий:

получение сегментного первоначального сигнала частотной области и сегментного целевого сигнала частотной области путем соответственного сегментирования и выполнения преобразования Фурье в отношении первоначального аудиосигнала и исходного целевого аудиосигнала, полученного при изменении высоты тона первоначального аудиосигнала;

получение соответствующих первоначальных областей формант путем фильтрации сегментных первоначальных сигналов частотной области на основании первоначальной сегментной функции-окна и получение соответствующей целевой области формант путем фильтрации сегментного целевого сигнала частотной области на основании целевой сегментной функции-окна, причем первоначальная сегментная функция-окно определяется на основании главной частоты и отношения сегментов сегментного первоначального сигнала частотной области, а целевая сегментная функция-окно определяется на основании главной частоты и отношения сегментов сегментного целевого сигнала частотной области; и

определение аудиосигнала с измененной высотой тона на основании сегментного целевого сигнала частотной области и соотношения первоначальных областей формант и целевой области формант, соответствующей сегментному целевому сигналу частотной области;

при этом изменение высоты тона исходного целевого аудиосигнала состоит в регулировке высоты тона аудио, и изменение высоты тона аудиосигнала с измененной высотой тона обеспечивает непротиворечивость характеристик голоса в аудиосигнале до и после изменения высоты тона.

2. Способ по п. 1, дополнительно предусматривающий:

получение амплитуды изменения высоты тона; и

получение исходного целевого аудиосигнала путем изменения высоты тона первоначального аудиосигнала на основании амплитуды изменения высоты тона.

3. Способ по п. 2, в котором главная частота сегментного целевого сигнала частотной области является произведением главной частоты сегментного первоначального сигнала частотной области, и амплитуды изменения высоты тона.

4. Способ по п. 1, отличающийся тем, что перед фильтрацией сегментного первоначального сигнала частотной области на основании первоначальной сегментной функции-окна этот способ дополнительно предусматривает:

использование переносимой главной частоты в качестве главной частоты текущего сегментного первоначального сигнала частотной области, если текущий сегментный первоначальный сигнал частотной области несет главную частоту; и

если текущий сегментный первоначальный сигнал частотной области не несет главную частоту, определение главной частоты текущего сегментного первоначального сигнала частотной области на основании главной частоты предыдущего сегментного первоначального сигнала частотной области и главной частоты последующего сегментного первоначального сигнала частотной области.

5. Способ по п. 4, в котором определение главной частоты текущего сегментного первоначального сигнала частотной области на основании главной частоты предыдущего сегментного первоначального сигнала частотной области и главной частоты последующего сегментного первоначального сигнала частотной области предусматривает:

вычисление – с использованием интерполяционного алгоритма – главной частоты предыдущего сегментного первоначального сигнала частотной области и главной частоты последующего сегментного первоначального сигнала частотной области с целью получения главной частоты текущего сегментного первоначального сигнала частотной области.

6. Способ по п. 1, отличающийся тем, что перед получением соответствующей первоначальной области формант путем фильтрации сегментного первоначального сигнала частотной области на основании первоначальной сегментной функции-окна этот способ дополнительно предусматривает:

получение соответствующей первоначальной длины окна на основании главной частоты и отношения сегментов сегментного первоначального сигнала частотной области; и

построение соответствующей первоначальной сегментной функции-окна на основании первоначальной длины окна и заданного типа окна.

7. Способ по п. 1, отличающийся тем, что перед получением соответствующей целевой области формант путем фильтрации сегментного целевого сигнала частотной области на основании целевой сегментной функции-окна этот способ дополнительно предусматривает:

получение соответствующей целевой длины окна на основании главной частоты и длины сегмента сегментного целевого сигнала частотной области; и

построение соответствующей целевой сегментной функции-окна на основании целевой длины окна и заданного типа окна.

8. Способ по п. 1, в котором получение сегментного первоначального сигнала частотной области и сегментного целевого сигнала частотной области путем соответственного сегментирования и выполнения преобразования Фурье в отношении первоначального аудиосигнала и исходного целевого аудиосигнала, полученного при изменении высоты тона первоначального аудиосигнала, предусматривает:

получение сегментного первоначального аудиосигнала и сегментного целевого аудиосигнала путем сегментирования – на основании заданной длины сегмента и смещения сегмента – первоначального аудиосигнала и исходного целевого аудиосигнала; и

получение сегментного первоначального сигнала частотной области и сегментного целевого сигнала частотной области путем выполнения преобразования Фурье в отношении сегментного первоначального аудиосигнала и сегментного целевого аудиосигнала.

9. Способ по п. 8, в котором определение аудиосигнала с измененной высотой тона на основании сегментного целевого сигнала частотной области и соотношения первоначальной области формант и целевой области формант, соответствующей сегментному целевому сигналу частотной области, предусматривает:

определение – для единичного сегментного целевого сигнала частотной области – отношения изменения высоты тона, соответствующего сегментному целевому сигналу частотной области, на основании соответствующей первоначальной области формант и целевой области формант;

определение соответствующего сегментного сигнала частотной области с измененной высотой тона на основании сегментного целевого сигнала частотной области и отношения изменения высоты тона;

определение сегментного аудиосигнала с измененной высотой тона путем выполнения обратного преобразования Фурье в отношении сегментного сигнала частотной области с измененной высотой тона; и

определение аудиосигнала с измененной высотой тона на основании каждого сегментного аудиосигнала с измененной высотой тона, заданной длины сегмента и смещения сегмента.

10. Устройство для преобразования аудиосигнала, включающее в себя:

модуль сегментации и преобразования, выполненный с возможностью получения сегментного первоначального сигнала частотной области и сегментного целевого сигнала частотной области путем соответственного сегментирования и выполнения преобразования Фурье в отношении первоначального аудиосигнала и сегментного целевого аудиосигнала, полученного при изменении высоты тона первоначального аудиосигнала;

модуль определения областей формант, выполненный с возможностью получения соответствующей первоначальной области формант путем фильтрации сегментного первоначального сигнала частотной области на основании первоначальной сегментной функции-окна и получения соответствующей целевой области формант путем фильтрации множества сегментных целевых сигналов частотной области на основании целевой сегментной функции-окна, причем первоначальная сегментная функция-окно определяется на основании главной частоты и длины сегмента сегментного первоначального сигнала частотной области, а целевая сегментная функция-окно определяется на основании главной частоты и длины сегмента сегментного целевого сигнала частотной области; и

модуль определения аудиосигнала с измененной высотой тона, выполненный с возможностью определения аудиосигнала с измененной высотой тона на основании сегментного целевого сигнала частотной области и соотношения первоначальных областей формант и целевой области формант, соответствующей сегментному целевому сигналу частотной области;

11. Электронное устройство для преобразования аудиосигнала, содержащее:

один или несколько процессоров; и

запоминающее устройство, выполненное с возможностью хранения одной или нескольких программ;

причем при выполнении одной или нескольких программ одним или несколькими процессорами инициируется реализация одним или несколькими процессорами способа преобразования аудиосигнала по любому из предшествующих пп. 1-9.

12. Машиночитаемый носитель данных, в котором хранится компьютерная программа; при этом компьютерная программа при ее выполнении процессором инициирует реализацию этим процессором способа преобразования аудиосигнала по любому из предшествующих пп. 1-9.

Изобретение относится к области обработки аудиосигналов. Техническим результатом является обеспечение подавления шума и подавления реверберации для аудиосигналов.

Устройство эхоподавления, способ эхоподавления и программа эхоподавления // 2767297

Настоящее изобретение относится к устройству эхоподавления, способу эхоподавления и программе эхоподавления. Техническим результатом является обеспечение эффективного удаления эха и одновременное снижение вычислительной нагрузки на арифметическое устройство.

Способ и устройство для декодирования амбиофонического аудиопредставления звукового поля для проигрывания аудио с использованием 2d-компоновок // 2766560

Изобретение относится к средствам для обработки аудиопредставления звукового поля. Технический результат заключается в повышении эффективности обработки аудиопредставления звукового поля.

Декодирование битовых аудиопотоков с метаданными расширенного копирования спектральной полосы по меньшей мере в одном заполняющем элементе // 2764186

Изобретение относится к средствам для декодирования битового аудиопотока с метаданными расширенного копирования спектральной полосы. Технический результат заключается в повышении эффективности декодирования.

Улучшенное расширение диапазона частот в декодере звукового сигнала // 2763848

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в повышении точности декодирования сигнала звуковой частоты.

Способ и устройство обработки сигнала // 2763785

Настоящее изобретение относится к средствам для обработки сигнала. Технический результат заключается в повышении эффективности обработки сигнала.

Декодирование битовых потоков аудио с метаданными расширенного копирования спектральной полосы в по меньшей мере одном заполняющем элементе // 2760700

Изобретение относится к средствам для кодирования и декодирования аудио с метаданными расширенного копирования спектральной полосы. Технический результат заключается в повышении эффективности кодирования и декодирования аудио.

Способ и устройство для захвата аудиоинформации с использованием формирования диаграммы направленности // 2760097

Изобретение относится к акустике. Устройство для приема аудиоинформации содержит: массив микрофонов, один формирователь диаграммы направленности, множество ограниченных формирователей диаграммы направленности, первый адаптер для адаптации параметров диаграммы направленности первого формирователя диаграммы направленности, второй адаптер для адаптации параметров ограниченной диаграммы направленности для множества ограниченных формирователей диаграммы направленности, процессор разности для вычисления разности между ограниченными диаграммами направленности.

Звукозапись с использованием формирования диаграммы направленности // 2759715

Изобретение относится к акустике. Средство формирования диаграммы направленности содержит микрофонную решетку, которая присоединена к первому формирователю диаграммы направленности и второму формирователю диаграммы направленности.

Система и способ для генерирования ряда сигналов высокочастотных поддиапазонов // 2758466

Изобретение относится к средствам для высокочастотной реконструкции звуковых сигналов. Технический результат заключается в повышении качества высокочастотной составляющей звукового сигнала.

Усовершенствованное гармоническое преобразование на основе блока поддиапазонов // 2772356

Группа решений относится к системам кодирования исходного звукового сигнала, которые используют способ гармонического преобразования для высокочастотной реконструкции (HFR), а также к процессорам цифровых эффектов, например эксайтерам, в которых генерирование гармонического искажения добавляет яркость в обрабатываемый сигнал, и к временным расширителям, в которых длительность сигнала увеличивается при сохранении спектрального состава. Система и способ сконфигурированы для генерирования растянутого во времени и/или преобразованного по частоте сигнала из входного сигнала. Система включает блок анализирующих фильтров, сконфигурированный для создания сигнала анализируемого поддиапазона из входного сигнала; где сигнал анализируемого поддиапазона включает ряд комплекснозначных анализируемых дискретных значений, каждое из которых имеет фазу и амплитуду. Кроме того, система включает модуль обработки поддиапазонов, сконфигурированный для определения сигнала синтезируемого поддиапазона из сигнала анализируемого поддиапазона с использованием коэффициента Q преобразования поддиапазона и коэффициента S растягивания поддиапазона. Модуль обработки поддиапазонов выполняет нелинейную обработку на блочной основе, где амплитуда дискретных значений сигнала синтезируемого поддиапазона определяется из амплитуды соответствующих дискретных значений сигнала анализируемого поддиапазона и предварительно определяемого дискретного значения сигнала анализируемого поддиапазона. Кроме того, система включает блок синтезирующих фильтров, сконфигурированный для генерирования растянутого во времени и/или преобразованного по частоте сигнала из сигнала синтезируемого поддиапазона. Технический результат – снижение вычислительной сложности при сохранении качественного звучания сигнала для различных типов сигналов. 3 н.п. ф-лы, 7 ил.