Способ, устройство и система для подавления шума

Авторы патента:

ЛЯН Тяньцай (CN)

ДУ Гаофэн (CN)

ЛЮ Цзяньпин (CN)

ЦЗИНЬ Сяофэн (CN)

G10L25/30 - Анализирование или синтезирование речи; распознавание речи (ввод/вывод звука для компьютеров G06F 3/16; способы или устройства для обработки цифровых данных, специально предназначенных для манипулирования данными на естественном языке G06F 17/20; обучение или общение со слепыми, глухими или немыми G09B 21/00; телефонная связь H04M)

G10L21/0208 - Обработка сигналов речи для получения иного слышимого или неслышимого сигнала, например визуального, осязаемого, для того, чтобы модифицировать их качество или их разборчивость (G10L 19/00 имеет преимущество)

Владельцы патента RU 2685391:

Джи Ар Джи БЭНКИНГ ЭКВИПМЕНТ КО., ЛТД. (CN)

Изобретение относится к средствам для подавления шума. Технический результат заключается в повышении эффективности подавления шума. Принимают устройством подавления шума внутренний шум, воспринятый контрольным механизмом восприятия речи, и речевой сигнал, содержащий внешний шум, воспринятый главным механизмом восприятия речи, когда вводится речевой сигнал. Извлекают внутренний признак сигнала, соответствующий внутреннему шуму, при этом внутренний признак сигнала является последовательностью кадров энергетического спектра. Вычисляют внешний признак аппроксимации, соответствующий внешнему шуму, на основе внутреннего признака сигнала и предварительно заданной формулы отображения, при этом внешний признак аппроксимации является последовательностью кадров в форме энергетического спектра. Преобразуют внешний признак аппроксимации в оценку шумового сигнала обратным преобразованием Фурье. Выполняют предварительно заданный процесс подавления шума по оценке шумового сигнала и воспринятому речевому сигналу, содержащему внешний шум, для получения свободного от шумов речевого сигнала. 3 н. и 7 з.п. ф-лы, 6 ил.

[0001] Данная заявка испрашивает приоритет по китайской заявке на патент № 201510312269.8, озаглавленной ʺСПОСОБ, УСТРОЙСТВО И СИСТЕМА ДЛЯ ПОДАВЛЕНИЯ ШУМАʺ, поданной Государственному ведомству по интеллектуальной собственности Китайской Народной Республики, которая включена в данный документ полностью путем ссылки.

ОБЛАСТЬ ТЕХНИКИ

[0002] Настоящее изобретение относится к технологии обработки речевого сигнала и, конкретно, к способу подавления шума, устройству подавления шума и системе подавления шума.

УРОВЕНЬ ТЕХНИКИ

[0003] Устройства с речевым взаимодействием обычно включают в себя много механических компонентов, которые производят большое количество быстро изменяющихся нестабильных машинных шумов и ударных шумов во время работы. Шум попадает в систему через микрофон на устройстве, что сильно влияет на речевое взаимодействие. Традиционные способы подавления шума, основанные на оценке шумового энергетического спектра, оказывают слабое воздействие на фильтрацию большого количества быстро изменяющихся нестабильных машинных шумов и ударных шумов. В традиционной технологии часто используется устройство подавления шума с двумя микрофонами для фильтрации окружающего шума. Устройство включает в себя главный микрофон для приема окружающего шума и речи и контрольный микрофон для приема окружающего шума. Шум подавляется, используя два этих сигнала, известным способом активного шумоподавления (ANC). Однако ANC способ требует, чтобы шум принимался главным микрофоном и контрольным микрофоном от по существу одного и того же звукового поля, с тем чтобы шумовые сигналы, принятые главным микрофоном и контрольным микрофоном, находились в сильно линейном соотношении. При этом условии ANC способ работает правильно, тогда как если это условие не выполняется, способ подавления шума с двумя микрофонами часто не работает правильно. Фактически устройство часто имеет относительно закрытый корпус. Контрольный шумовой микрофон устанавливается в корпусе для приема машинного шума, тогда как главный микрофон в общем случае устанавливается снаружи или в отверстии корпуса для приема речи. В этом случае звуковые поля контрольного микрофона и главного микрофона совершенно различны, что приводит к низкой эффективности или неработоспособности ANC способа.

[0004] Поэтому желательно решить вышеупомянутую техническую проблему низкой эффективности ANC способа, являющуюся следствием существенного различия между звуковыми полями контрольного микрофона и главного микрофона.

СУЩНОСТЬИЗОБРЕТЕНИЯ

[0005] Способ, устройство и система подавления шума обеспечены согласно варианту осуществления настоящего изобретения для решения технической проблемы низкой эффективности ANC способа, являющейся следствием существенного различия между звуковыми полями контрольного микрофона и главного микрофона.

[0006] Способ подавления шума обеспечивается согласно варианту осуществления настоящего изобретения, который включает в себя:

[0007] S7, прием устройством подавления шума внутреннего шума, воспринимаемого контрольным механизмом восприятия речи, и речевого сигнала, содержащего внешний шум, воспринимаемый главным механизмом восприятия речи, когда вводится речевой сигнал.

[0008] S2, извлечение внутреннего признака сигнала, соответствующего внутреннему шуму, где внутренний признак сигнала является последовательностью кадров энергетического спектра.

[0009] S3, восприятие внешнего признака аппроксимации, соответствующего внешнему шуму, основываясь на внутреннем признаке сигнала и предварительно заданной формуле отображения, где внешний признак сигнала является последовательностью кадров в форме энергетического спектра.

[0010] S4, преобразование внешнего признака аппроксимации в оценку шумового сигнала обратным преобразованием Фурье, и.

[0011] S5, выполнение предварительно заданного процесса подавления шума по оценке шумового сигнала и воспринятому речевом сигналу, содержащему внутренний шум, для получения свободного от шумов речевого сигнала с подавленным шумом.

[0012] Предпочтительно перед этапом S1 способ дополнительно включает в себя:

[0013] обучение, при условии отсутствия введенного речевого сигнала, предварительно заданной структуры автоматически кодирующей нейросети с помощью выборок шумового сигнала, состоящих из внутреннего шума и внешнего шума, для определения формулы отображения.

[0014] Предпочтительно обучение структуры автоматически кодирующей нейросети включает в себя:

[0015] S6, выполнение преобразования Фурье применительно к каждому предварительно заданному кадру каждой из выборок шумового сигнала с целью получения признака и угловой информации выборки для кадра выборки, где признак кадра выборки представляется в форме энергетического спектра;

[0016] S7, определение обучающего набора выборок , используя признак кадра выборки в качестве входа x(n) выборки и ожидаемого выхода o(n) предварительно заданной структуры автоматически кодирующей нейросети;

[0017] S8, выполнение обучения с помощью каждой обучающей выборки из обучающего набора выборок для определения весового вектора и параметра смещения, соответствующих обучающему набору выборок ; и

[0018] S9, добавление определенного весового вектора и определенного параметра смещения в предварительно заданную структуру автоматически кодирующей нейросети для получения формулы отображения обучающего набора выборок .

[0019] Предпочтительно этап S5 конкретно включает в себя:

[0020] выполнение ANC процесса подавления шума по оценке шумового сигнала и воспринятому речевом сигналу, содержащему внутренний шум, для получения свободного от шумов речевого сигнала с подавленным шумом.

[0021] Предпочтительно предварительно заданная структура автоматически кодирующей нейросети является структурой с 5 уровнями, причем первый уровень и пятый уровень являются уровнями входа и выхода, а второй уровень, третий уровень и четвертый уровень являются скрытыми уровнями.

[0022] Устройство подавления шума обеспечивается в соответствии с вариантом осуществления настоящего изобретения, который включает в себя:

[0023] приемный блок, выполненный с возможностью приема внутреннего шума, воспринятого контрольным механизмом восприятия речи, и речевого сигала, содержащего внешний шум, воспринятый главным механизмом восприятия речи, когда вводится речевой сигнал;

[0024] извлекающий блок, выполненный с возможностью извлечения внутреннего признака сигнала, соответствующего внутреннему шуму, причем внутренний признак сигнала является последовательностью кадров энергетического спектра;

[0025] воспринимающий юлок, выполненный с возможностью восприятия внешнего признака аппроксимации, соответствующего внешнему шуму, основываясь на внутреннем признаке сигнала и предварительно заданной формуле отображения, где внешний признак аппроксимации является последовательностью кадров в форме энергетического спектра;

[0026] преобразующий блок, выполненный с возможностью преобразования внешнего признака аппроксимации в оценку шумового сигнала обратным преобразованием Фурье; и

[0027] блок устранения шума, выполненный с возможностью выполнения предварительно заданного процесса подавления шума по оценке шумового сигнала и воспринятому речевом сигналу, содержащему внутренний шум, для получения свободного от шумов речевого сигнала с подавленным шумом.

[0028] Предпочтительно устройство подавления шума дополнительно включает в себя:

[0029] обучающий блок, выполненный с возможностью обучения, при условии отсутствия введенного речевого сигнала, предварительно заданной структуры автоматически кодирующей нейросети с помощью выборок шумового сигнала, состоящих из внутреннего шума и внешнего шума, для определения формулы отображения.

[0030] Предпочтительно обучающий блок конкретно включает в себя:

[0031] преобразующий подблок, выполненный с возможностью выполнения, при условии отсутствия введенного речевого сигнала, преобразования Фурье применительно к каждому предварительно заданному кадру каждой из выборок шумового сигнала для получения признака и угловой информации выборки для кадра выборки, где признак кадра выборки представляется в форме энергетического спектра;

[0032] первый определяющий подблок, выполненный с возможностью определения обучающего набора выборок , используя признак кадра выборки в качестве входа x(n) выборки и ожидаемого выхода o(n) предварительно заданной структуры автоматически кодирующей нейросети.

[0033] второй определяющий подблок, выполненный с возможностью обучения с помощью каждой обучающей выборки из обучающего набора выборок для определения весового вектора и параметра смещения, соответствующих обучающему набору выборок ; и

[0034] вычислительный подблок, выполненный с возможностью добавления определенного весового вектора и определенного параметра смещения в предварительно заданную структуру автоматически кодирующей нейросети для получения формулы отображения для обучающего набора выборок .

[0035] Система подавления шума обеспечивается согласно варианту осуществления настоящего изобретения, который включает в себя:

[0036] контрольный механизм восприятия речи, главный механизм восприятия речи и устройство подавления шума согласно любому из вариантов осуществления настоящего изобретения.

[0037] Контрольный механизм восприятия речи и главный механизм восприятия речи находятся соответственно в связи по передаче сигналов с устройством подавления шума.

[0038] Контрольный механизм восприятия речи выполнен с возможностью восприятия внутреннего шумового сигнала.

[0039] Устройство подавления шума выполнено с возможностью приема внутреннего шума и речевого сигнала, содержащего внешний шум, когда вводится речевой сигнал, извлечения внутреннего признака сигнала, соответствующего внутреннему шуму, восприятия внешнего признака аппроксимации, соответствующего внешнему шуму, основываясь на внутреннем признаке сигнала и предварительно заданной формуле отображения, преобразования внешнего признака аппроксимации в оценку шумового сигнала обратным преобразованием Фурье и выполнения предварительно заданного процесса подавления шума по оценке шумового сигнала и воспринятому речевом сигналу, содержащему внутренний шум, для получения свободного от шумов сигнала с подавленным шумом.

[0040] Главный механизм восприятия речи выполнен с возможностью восприятия речи, содержащей внутренний шум.

[0041] Внутренний признак сигнала является последовательностью кадров энергетического спектра, и внешний признак аппроксимации является последовательностью кадров в форме энергетического спектра.

[0042] Предпочтительно главный механизм восприятия речи дополнительно выполнен с возможностью восприятия внешнего шума при условии отсутствия введенного речевого сигнала, так что устройство подавления шума обучает, при условии отсутствия введенного речевого сигнала, предварительно заданную структуру автоматически кодирующей нейросети с помощью выборок шумового сигнала, состоящих из внутреннего шума и внешнего шума, для определения формулы отображения.

[0043] Как можно увидеть из приведенного выше технического решения, варианты осуществления настоящего изобретения имеют перечисленные далее преимущества.

[0044] Способ, устройство и система подавления шума обеспечены в соответствии с вариантами осуществления настоящего изобретения. Способ подавления шума включает в себя: этап S1, прием устройством подавления шума внутреннего шума, воспринятого контрольным механизмом восприятия речи, и речевого сигнала, содержащего внешний шум, воспринятый главным механизмом восприятия речи, когда вводится речевой сигнал; этап S2, извлечение внутреннего признака сигнала, соответствующего внутреннему шуму, причем внутренний признак сигнала является последовательностью кадров энергетического спектра; этап S3, восприятие внешнего признака аппроксимации, соответствующего внешнему шуму, основываясь на внутреннем признаке сигнала и предварительно заданной формуле отображение, причем внешний признак аппроксимации является последовательностью кадров в форме энергетического спектра; этап S4, преобразование внешнего признака аппроксимации в оценку шумового сигнала обратным преобразованием Фурье; и этап S5, выполнение предварительно заданного процесса подавления шума по оценке шумового сигнала и воспринятому речевом сигналу, содержащему внутренний шум, для получения свободного от шумов речевого сигнала с подавленным шумом. В вариантах осуществления внутренний признак сигнала, соответствующий внутреннему шуму, извлекается, внешний признак аппроксимации, соответствующий внешнему шуму, воспринимается на основе внутреннего признака сигнала и предварительно заданной формулы отображения, внешний признак аппроксимации преобразуется в оценку шумового сигнала, и процесс подавления шума выполняется, используя оценку шумового сигнала и речевой сигнал, тем самым устраняя ограничение, обусловленное существенным различием между внешними звуковыми полями, и решая проблему низкой эффективности ANC способа, являющуюся следствием существенного различия между звуковыми полями контрольного микрофона и главного микрофона.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0045]. Сопроводительные чертежи к описанию вариантов осуществления или традиционной технологии кратко описываются далее, с тем чтобы технические решения согласно вариантам осуществления в настоящем изобретении или традиционная технология стали более ясными. Очевидно, что сопроводительные чертежи в последующем описании представляют лишь некоторые варианты осуществления настоящего изобретения. Для специалистов в данной области техники могут быть получены другие сопроводительные чертежи, соответствующие этим сопроводительным чертежам, без какой-либо созидательной работы.

[0046] ФИГ. 1 - блок-схема последовательности операций в способе подавления шума согласно варианту осуществления настоящего изобретения;

[0047] ФИГ. 2 - блок-схема последовательности операций в способе подавления шума согласно другому варианту осуществления настоящего изобретения;

[0048] ФИГ. 3 - структурная блок-схема устройства подавления шума согласно варианту осуществления настоящего изобретения;

[0049] ФИГ. 4 - структурная блок-схема устройства подавления шума согласно другому варианту осуществления настоящего изобретения;

[0050] ФИГ. 5 - структурная блок-схема системы подавления шума согласно варианту осуществления настоящего изобретения;

[0051] ФИГ. 6 - схематическое изображение соединений автоматически кодирующей нейросети в системе подавления шума согласно варианту осуществления настоящего изобретения.

ПОДРОБНОЕ ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

[0052] Способ подавления шума, устройство подавления шума и система подавления шума обеспечены в соответствии с вариантами осуществления настоящего изобретения для решения технической проблемы низкой эффективности ANC способа, являющейся следствием существенного различия между звуковыми полями контрольного микрофона и главного микрофона.

[0053] Техническое решение согласно вариантам осуществления настоящего изобретения будет далее четко и полно описано в сочетании с сопроводительными чертежами в вариантах осуществления настоящего изобретения, так что цели, характеристики и преимущества настоявшего изобретения могут стать более ясными и понятными. Очевидно, что описываемые варианты осуществления являются только частью вариантов осуществления согласно настоящему изобретению. Все другие варианты осуществления, полученные специалистами в данной области техники, которые основаны на вариантах осуществления в настоящем изобретении без какой-либо созидательной работы, укладываются в объем настоящего изобретения.

[0054] Как показано на фиг. 1, способ подавления шума согласно варианту осуществления настоящего изобретения включает в себя этапы с S1 по S5.

[0055] На этапе S1, когда вводится речевой сигнал, устройство подавления шума принимает внутренний шум, воспринятый контрольным механизмом восприятия речи, и речевой сигнал, содержащий внешний шум, воспринятый главным механизмом восприятия речи.

[0056] Когда требуется освободить от шума речевой сигнал, устройство подавления шума принимает внутренний шум, воспринятый контрольным механизмом восприятия речи, и речевой сигнал, содержащий внешний шум, воспринятый главным механизмом восприятия речи, когда вводится речевой сигнал.

[0057] На этапе S2 извлекается внутренний признак сигнала, соответствующий внутреннему шуму.

[0058] После приема внутреннего шума, воспринятого контрольным механизмом восприятия речи, и речевого сигнала, содержащего внешний шум, воспринятый главным механизмом восприятия речи, устройство подавления шума извлекает внутренний признак сигнала, соответствующий внутреннему шуму. Внутренний признак сигнала является последовательностью кадров энергетического спектра.

[0059] На этапе S3, основываясь на внутреннем признаке сигнала и предварительно заданной формуле отображения, воспринимается внешний признак аппроксимации, соответствующий внешнему шуму.

[0060] После того как будет извлечен внутренний признак сигнала, соответствующий внутреннему шуму, воспринимается внешний признак аппроксимации, соответствующий внешнему шуму, на основе внутреннего признака сигнала и предварительно заданной формулы отображения. Внешний признак аппроксимации является последовательностью кадров в форме энергетического спектра.

[0061] На этапе S4 внешний признак аппроксимации преобразуется в оценку шумового сигнала обратным преобразованием Фурье.

[0062] После того как внешний признак аппроксимации, соответствующий внешнему шуму, будет воспринят на основе внутреннего признака сигнала и предварительно заданной формулы отображения, внешний признак аппроксимации преобразуется в соответствующую оценку шумового сигнала обратным преобразованием Фурье.

[0063] На этапе S5 выполняется предварительно заданный процесс подавления шума по оценке шумового сигнала и воспринятому речевому сигналу, содержащему внутренний шум, для получения свободного от шумов речевого сигнала с подавленным шумом.

[0064] После того как внешний признак аппроксимации будет преобразован в соответствующую оценку шумового сигнала обратным преобразованием Фурье, выполняется предварительно заданный процесс подавления шума по оценке шумового сигнала и воспринятому речевому сигналу, содержащему внутренний шум, для получения свободного от шумов речевого сигнала с подавленным шумом.

[0065] В варианте осуществления внутренний признак сигнала, соответствующий внутреннему шуму, извлекается, внешний признак аппроксимации, соответствующий внешнему шуму, воспринимается на основе внутреннего признака сигнала и предварительно заданной формулы отображения, внешний признак аппроксимации преобразуется в оценку шумового сигнала, и процесс подавления шума выполняется на оценке шумового сигнала и речевом сигнале, устраняя тем самым ограничение вследствие существенного различия между внешними звуковыми полями и решая техническую проблему низкой эффективности ANC способа, являющуюся следствием существенного различия между звуковыми полями контрольного микрофона и главного микрофона.

[0066] Способ подавления шума подробно описан выше, а обучение структуры автоматически кодирующей нейросети подробно описывается ниже. Как показано на фиг. 2, способ подавления шума согласно другому варианту осуществления настоящего изобретения включает в себя этапы с 201 по 209.

[0067] На этапе 201, при условии отсутствия введенного речевого сигнала, выполняется преобразование Фурье применительно к каждому предварительно заданному кадру воспринятой выборки шумового сигнала для получения признака и угловой информации выборки для кадра выборки.

[0068] Прежде чем освобождать от шума речевой сигнал, предварительно заданная структура автоматически кодирующей нейросети обучается с помощью выборок шумового сигнала, состоящих из внутреннего шума и внешнего шума, при условии отсутствия введенного речевого сигнала для определения формулы отображения. Описанная выше предварительно заданная структура автоматически кодирующей нейросети может быть получена выполнением преобразования Фурье применительно к каждому предварительно заданному кадру воспринятой выборки шумового сигнала при условии отсутствия введенного речевого сигнала с целью получения признака соответствующего кадра выборки и угловой информации выборки.

[0069] Например, до приема речевого сигнала как контрольный механизм восприятия речи (такой как контрольный микрофон), так и главный механизм восприятия речи (такой как главный микрофон) собирают внутренний шум машины и шум машины, утекавший соответственно во внешнее пространство в течение более 100 часов, чтобы сформировать выборки шумового сигнала. Устройство может быть снабжено устройством подавления шума, таким как дистанционный смарт-диспетчер (smart teller). Воспринятые выборки шумового сигнала выбираются на частоте 8 кГц, затем выполняется процесс оконного преобразования (windowing) применительно к выборкам шумового сигнала с окном Хэмминга в 32 мс для получения последовательности кадров. Каждый из кадров имеет 256 точек выборки. После этого выполняется преобразование Фурье применительно к каждому из кадров выборок шумового сигнала. Энергетический спектр S(ω) и угол angle(ω) выборки шумового сигнала получаются нахождением квадрата преобразованных коэффициентов Фурье. Энергетический спектр S(ω) используется как внутренний признак, а угол angle(ω) используется для преобразования внутреннего признака обратно в сигнал.

[0070] На этапе 202, используя признак кадра выборки в качестве входа x(n) выборки и ожидаемого выхода o(n) структуры автоматически кодирующей нейросети, определяется обучающий набор выборок .

[0071] После того как преобразование Фурье будет выполнено применительно к каждому предварительно заданному кадру из воспринятой выборки шумового сигнала для получения признака соответствующего кадра выборки и угловой информации выборки, обучающий набор выборок определяется, используя признак кадра выборки в качестве входа x(n) выборки и ожидаемого выхода o(n) структуры автоматически кодирующей нейросети. Например, 5 последовательных кадров логарифмического энергетического спектра S(ω) каждого внутреннего признака шумового сигнала, принятые контрольным микрофоном и главным микрофоном, принимаются за внутренний признак речевого сигнала и за вход и ожидаемый выход автоматически кодирующей нейросети, и все состоящие из 5 кадров признаки сигнала, извлекаемые из сигналов главного микрофона и сигналов контрольного микрофона, образуют обучающий набор выборок , который используется на этапе 203.

[0072] На этапе 203 обучение выполняется с помощью каждой обучающей выборки из обучающего набора выборок для определения весового вектора и параметра смещения, соответствующих обучающему набору выборок .

[0073] После того как будет определен обучающий набор выборок , используя признак кадра выборки в качестве входа x(n) выборки и ожидаемого выхода o(n) структуры автоматически кодирующей нейросети, выполняется обучение с помощью каждой обучающей выборки из обучающего набора выборок для определения весового вектора и параметра смещения, соответствующих обучающему набору выборок .

[0074] Например, предварительно заданная структура автоматически кодирующей нейросети является структурой с 5 уровнями. Первый уровень и пятый уровень являются уровнями входа и выхода, каждый из которых имеет 1280 узлов, что определяет размерность 5-кадрового признака сигнала. Второй уровень, третий уровень и четвертый уровень являются скрытыми уровнями, каждый из которых имеет 1024 узла. Большее число скрытых уровней и большее число узлов приводит в результате к более точному отображению сети, а также при этом приводит к большему числу вычислений и большему числу требуемых выборок. Следует заметить, что число скрытых уровней и число узлов на уровень определяются на основе компромисса. Сеть является полностью соединенной сетью. x(n) используется в качестве входа сети, а o(n) используется в качестве ожидаемого выхода сети. Заметим, что упомянутая выше структура нейросети может быть такой, как показана на фиг. 6.

[0075] Для n-й обучающей выборки входом является x(n), ожидаемым выходом является o(n) и нейронным выходным вектором входного уровня является….

0076] Конечным результатом обучения является вычисление веса и параметра смещения автоматически кодирующей нейросети на основе входа и ожидаемого выходного набора выборок .

[0077] Ниже описывается процесс обучения сети.

[0078] A) Начальное весовое значение выбирается произвольно в соответствии со структурой автоматически кодирующей нейросети, а значение смещения устанавливается равным нулю. Берется первая выборка в набору обучающих выборок, где n=1.

[0079] B) В соответствии с формулой y_l(n)=x(n) входной вектор x(n) отображается в нейронный выходной вектор y_l(n) входного уровня.

[0080] С) В соответствии с вычислительной формулой отношения отображения нейронный выходной вектор входного уровня отображается в нейронный выходной вектор первого скрытого уровня, нейронный выходной вектор первого скрытого уровня отображается в нейронный выходной вектор второго скрытого уровня, нейронный выходной вектор второго скрытого уровня отображается в нейронный выходной вектор третьего скрытого уровня, и нейронный выходной вектор третьего скрытого уровня отображается в нейронный выходной вектор выходного уровня.

[0081] Вычислительная формула отношения отображения выражается в виде:

[0082] где , e - основание натурального логарифма, w_l - весовой вектор первого уровня, b_l- коэффициент смещения. Когда l=2, формула используется для отображения нейронного выходного вектора входного уровня в нейронный выходной вектор первого скрытого уровня. Когда l=3,4, формулы используются для отображения нейронного выходного вектора первого скрытого уровня в нейронный выходной вектор второго скрытого уровня и отображения нейронного выходного вектора второго скрытого уровня в нейронный выходной вектор третьего уровня. Когда l=5, формулы используются для отображения нейронного выходного вектора третьего скрытого уровня в нейронный выходной вектор выходного уровня.

[0083] D) В соответствии с вектором выходного уровня и ожидаемым выходным вектором o(n) функция ошибки (которая является функцией для измерения точности выходов сети) рассчитывается по формуле .

[0084] E) В соответствии с формулой вычисления производной рассчитываются производные функции ошибки по отношению к весу и смещению каждого уровня.

[0085] Формула вычисления производной является следующей:

[0086] Для скрытого уровня мы имеем , и для выходного уровня мы имеем l=5, .

[0087] F) Основываясь на производных функции ошибки по отношению к весу и смещению каждого уровня, новые (new) веса и смещения рассчитываются по следующей вычислительной формуле:

[0088] В этой вычислительной формуле , , l=5,4,3,2 являются вариациями весов и смещений, а η представляет скорость обучения. Большое значение η приводит к колебаниям новых весов и смещений, тогда как малое значение η приводит к медленному обучению. В соответствии с настоящим изобретением определено компромиссное значение η=0,05.

[0089] G) Новые веса и смещения устанавливаются как веса и смещения автоматически кодирующей нейросети и выражаются следующим образом:

[0090] H) Если вариации каждого весового вектора и каждого параметра смещения (,, см. вычислительные формулы в F) меньше заданного порогового значения T_h, обучение заканчивается. В противном случае выбирается следующая выборка, то есть n=n+1, и процесс возвращается к этапу 202 для выполнения следующего раунда обучения. Большое пороговое значение T_h приводит к неадекватному обучению, тогда как малое пороговое значение T_h приводит к длительному обучению. В настоящем изобретении определено компромиссное значение T_h=0,001.

[0091] На этапе 204 определенный весовой вектор и определенный параметр смещения добавляются в предварительно заданную структуру автоматически кодирующей нейросети для получения формулы отображения для обучающего набора выборок .

[0092] После того как будет выполнено обучение с помощью каждой обучающей выборки из набора обучающих выборок для определения весового вектора и параметра смещения, соответствующих обучающему набору выборок , определенный весовой вектор и определенный параметр смещения добавляются в предварительно заданную структуру автоматически кодирующей нейросети для получения формулы отображения для обучающего набора выборок .

[0093] Результатом добавления весового вектора и данных смещения в структуру нейросети является отображение соотношения между внутренним признаком шумового сигнала и внешним признаком шумового сигнала. Формула отображения выражается как .

[0094] На этапе 205, когда вводится речевой сигнал, устройство подавления шума принимает внутренний шум, воспринятый контрольным механизмом восприятия речи, и речевой сигнал, содержащий внешний шум, воспринятый главным механизмом восприятия речи.

[0095] Когда вводится речевой сигнал, устройство подавления шума принимает внутренний шум, воспринятый контрольным механизмом восприятия речи, и речевой сигнал, содержащий внешний шум, воспринятый главным механизмом восприятия речи.

[0096] Необходимо заметить, что когда упомянутое выше устройство работает, контрольный микрофон воспринимает внутренний механический шум, а главный микрофон воспринимает речевой сигнал, содержащий механический шум. Согласно этапу 202 признак извлекается из шумового сигнала, воспринятого контрольным микрофоном, для получения информации о последовательности кадров энергетического спектра и угловой последовательности.

[0097] На этапе 206 извлекается внутренний признак сигнала, соответствующий внутреннему шуму.

[0098] После приема внутреннего шума, воспринятого контрольным механизмом восприятия речи, и речевого сигнала, содержащего внешний шум, воспринятый главным механизмом восприятия речи, устройство подавления шума извлекает внутренний признак сигнала, соответствующий внутреннему шуму. Внутренний признак сигнала является последовательностью кадров энергетического спектра.

[0099] Например, внутренний признак 5 последовательных кадров сигнала вводится в обученную автоматически колирующую нейросеть. В соответствии с формулой отображения, полученной на этапе 203, выходом сети является внешний признак аппроксимации шумового сигнала, принятого главным микрофоном.

[0100] На этапе 207, основываясь на внутреннем признаке сигнала и предварительно заданной формуле отображения, воспринимается внешний признак аппроксимации, соответствующий внешнему шуму.

[0101] После того как будет извлечен внутренний признак сигнала, соответствующий внутреннему шуму, воспринимается внешний признак аппроксимации, соответствующий внешнему шуму, на основе внутреннего признака сигнала и предварительно заданной формулы отображения. Внешний признак аппроксимации является последовательностью кадров в форме энергетического спектра.

[0102] Например, выполняется обратное преобразование Фурье на оценке шумового сигнала на выходе автоматически кодирующей нейросети с соответствующим углом кадра для получения оценочного шумового сигнала .

[0103] На этапе 208 внешний признак аппроксимации преобразуется в оценку шумового сигнала обратным преобразованием Фурье.

[0104] После того как внешний признак аппроксимации, соответствующий внешнему шуму, будет воспринят на основе внутреннего признака сигнала и предварительно заданной формулы отображения, внешний признак аппроксимации преобразуется в соответствующую оценку шумового сигнала обратным преобразованием Фурье.

[0105] На этапе 209 выполняется ANC процесс подавления шума по оценке шумового сигнала и воспринятому речевому сигналу, содержащему внутренний шум, для получения свободного от шумов речевого сигнала с подавленным шумом.

[0106] После того как внешний признак аппроксимации будет преобразован в соответствующую оценку шумового сигнала обратным преобразованием Фурье, выполняется ANC процесс подавления шума по оценке шумового сигнала и воспринятому речевому сигналу, содержащему внутренний шум, для получения свободного от шумов речевого сигнала с подавленным шумом.

[0107] Далее описывается упомянутый выше ANC процесс подавления шума.

[0108] Вектор, состоящий из оценки шумового сигнала в первые m моментов времени, принятых главным микрофоном за время n, обозначается как , речевой сигнал, содержащий механический шум, собранный главным микрофоном за время n, обозначается как , и является весовым коэффициентом фильтра, где T представляет транспозицию вектора. Большое число m приводит к большому числу вычислений, тогда как малое число m приводит к низкой эффективности подавления шума. В варианте осуществления m=32.

[0109] a) Начальное весовое значение W весового коэффициента фильтра выбирается произвольно в начальный момент времени n=1.

[0110] b) Основываясь на формуле , вычисляется речевой сигнал с подавленным шумом для времени n.

[0111] c) Основываясь на формуле , вычисляется новый весовой коэффициент фильтра. Параметр μ является обучающим фактором весового коэффициента. Большое или малое значение μ приводит к низкой эффективности подавления шума. В варианте осуществления μ=0,05.

[0112] d) Новый весовой коэффициент устанавливается как весовой коэффициент фильтра, то есть .

[0113] e) Оценка шумового сигнала и речевой сигнал, содержащий механический шум, выбираются в следующий момент времени, где n=n+1, и процесс возвращается к этапу b).

[0114] Вычисляется для каждого момента времени, используя ANC способ, чтобы служить в качестве речевого сигнала с подавленным шумом, полученного на выходе ANC способом для данного момента времени.

[0115] В варианте осуществления внутренний признак сигнала, соответствующий внутреннему шуму, извлекается, внешний признак аппроксимации, соответствующий внешнему шуму, воспринимается на основе внутреннего признака сигнала и предварительно заданной формулы отображения, внешний признак аппроксимации преобразуется в оценку шумового сигнала, и процесс подавления шума выполняется на оценке шумового сигнала и речевом сигнале, устраняя тем самым ограничение вследствие существенного различия между внешними звуковыми полями и решая техническую проблему низкой эффективности ANC способа, являющуюся следствием существенного различия между звуковыми полями контрольного микрофона и главного микрофона. Дополнительно сочетание нейросети и ANC способа значительно улучшает эффект устранения шума из речевого сигнала.

[0116] Как показано на фиг. 3, устройство подавления шума, обеспеченное в соответствии с вариантом осуществления настоящего изобретения, включает в себя: приемный блок 301, извлекающий блок 302, воспринимающий блок 303, преобразующий блок 304 и блок 305 устранения шума.

[0117] Приемный блок 301 выполнен с возможностью приема внутреннего шума, воспринятого контрольным механизмом восприятия речи, и речевого сигнала, содержащего внешний шум, воспринятый главным механизмом восприятия речи, когда вводится речевой сигнал.

[0118] Извлекающий блок 302 выполнен с возможностью извлечения внутреннего признака сигнала, соответствующего внутреннему шуму. И внутренний признак сигнала является последовательностью кадров энергетического спектра.

[0119] Воспринимающий блок 303 выполнен с возможностью восприятия внешнего признака аппроксимации, соответствующего внешнему шуму, на основе внутреннего признака сигнала и предварительно заданной формулы отображения. И внешний признак отображения является последовательностью кадров в форме энергетического спектра.

[0120] Преобразующий блок 304 выполнен с возможностью преобразования внешнего признака аппроксимации в оценку шумового сигнала обратным преобразованием Фурье.

[0121] Блок 305 устранения шума выполнен с возможностью выполнения предварительно заданного процесса подавления шума по оценке шумового сигнала и воспринятому речевом сигналу, содержащему внутренний шум, для получения свободного от шумов речевого сигнала с подавленным шумом.

[0122] В варианте осуществления извлекающий блок 302 извлекает внутренний признак сигнала, соответствующий внутреннему шуму, воспринимающий блок 302 воспринимает внешний признак аппроксимации, соответствующий внешнему шуму, на основе внутреннего признака сигнала и предварительно заданной формулы отображения, и блок 305 устранения шума выполняет процесс подавления шума на речевом сигнале и оценке шумового сигнала, преобразованной из внешнего признака аппроксимации, устраняя тем самым ограничение вследствие существенного различия между внешними звуковыми полями и решая техническую проблему низкой эффективности ANC способа, являющуюся следствием существенного различия между звуковыми полями контрольного микрофона и главного микрофона.

[0123] Блоки устройства подавления шума были подробно описаны выше, и дополнительные блоки будут подробно описаны ниже. Как показано на фиг. 4, устройство подавления шума согласно другому варианту осуществления настоящего изобретения включает в себя: обучающий блок 401, приемный блок 402, извлекающий блок 403, воспринимающий блок 404, преобразующий блок 405 и блок 406 устранения шума.

[0124] Обучающий блок 401 выполнен с возможностью обучения, при условии отсутствия введенного речевого сигнала, предварительно заданной структуры автоматически кодирующей нейросети с помощью выборок шумового сигнала, состоящих из внутреннего шума и внешнего шума, для определения формулы отображения.

[0125] Обучающий блок 401 включает в себя: преобразующий подблок 4011, первый определяющий подблок 4012, второй определяющий подблок 4013 и вычислительный подблок 4014.

[0126] Преобразующий подблок 4011 выполнен с возможностью выполнения, при условии отсутствия введенного речевого сигнала, преобразования Фурье применительно к каждому предварительно заданному кадру каждой из выборок шумового сигнала для получения признака и угловой информации выборки для кадра выборки. Признак кадра выборки находится форме энергетического спектра.

[0127] Первый определяющий подблок 4012 выполнен с возможностью определения обучающего набора выборок , используя признак кадра выборки в качестве входа x(n) выборки и ожидаемого выхода o(n) предварительно заданной структуры автоматически кодирующей нейросети.

[0128] Второй определяющий подблок 4013 выполнен с возможностью выполнения обучения с помощью каждой обучающей выборки из обучающего набора выборок для определения весового вектора и параметра смещения, соответствующих обучающему набору выборок .

[0129] Вычислительный подблок 4014 выполнен с возможностью добавления определенного весового вектора и определенного параметра смещения в предварительно заданную структуру автоматически кодирующей нейросети для получения формулы отображения для обучающего набора выборок .

[0130] Приемный блок 402 выполнен с возможностью приема внутреннего шума, воспринятого контрольным механизмом восприятия речи, и речевого сигала, содержащего внешний шум, воспринятый главным механизмом восприятия речи, когда вводится речевой сигнал.

[0131] Извлекающий блок 403 выполнен с возможностью извлечения внутреннего признака сигнала, соответствующего внутреннему шуму. Внутренний признак сигнала является последовательностью кадров энергетического спектра.

[0132] Воспринимающий блок 404 выполнен с возможностью восприятия внешнего признака аппроксимации, соответствующего внешнему шуму, на основе внутреннего признака сигнала и предварительно заданной формулы отображения. Внешний признак аппроксимации является последовательностью кадров в форме энергетического спектра.

[0133] Преобразующий блок 405 выполнен с возможностью преобразования внешнего признака аппроксимации в оценку шумового сигнала обратным преобразованием Фурье.

[0134] Блок 406 устранения шума выполнен с возможностью выполнения предварительно заданного процесса подавления шума по оценке шумового сигнала и воспринятому речевом сигналу, содержащему внутренний шум, для получения свободного от шумов речевого сигнала с подавленным шумом.

[0135] В варианте осуществления извлекающий блок 403 извлекает внутренний признак сигнала, соответствующий внутреннему шуму, воспринимающий блок 404 воспринимает внешний признак аппроксимации, соответствующий внешнему шуму, на основе внутреннего признака сигнала и предварительно заданной формулы отображения, и внешний признак аппроксимации преобразуется в оценку шумового сигнала, а блок 406 устранения шума выполняет процесс подавления шума на речевом сигнале и оценочном шумовом сигнале, преобразованным из внешнего признака аппроксимации, устраняя тем самым ограничение вследствие существенного различия между внешними звуковыми полями и решая техническую проблему низкой эффективности ANC способа, являющуюся следствием существенного различия между звуковыми полями контрольного микрофона и главного микрофона. Кроме того, сочетание нейросети и ANC способа значительно улучшает эффект устранения шума из речевого сигнала.

[0136] Как показано на фиг. 5, система подавления шума согласно варианту осуществления настоящего изобретения включает в себя: контрольный механизм 51 восприятия речи, главный механизм 52 восприятия речи и устройство 53 подавления шума в вариантах осуществления, показанных на фиг. 3 и фиг. 4.

[0137] Контрольный механизм 51 восприятия речи и главный механизм 52 восприятия речи находятся в соединении для передачи сигналов с устройством 53 подавления шума.

[0138] Контрольный механизм 51 восприятия речи выполнен с возможностью восприятия внутреннего шумового сигнала, такого как внутренний шумовой сигнал смарт-диспетчера.

[0139] Устройство 53 подавления шума выполнено с возможностью приема внутреннего шума и речевого сигнала, содержащего внешний шум, когда вводится речевой сигнал, извлечения внутреннего признака сигнала, соответствующего внутреннему шуму, восприятия внешнего признака аппроксимации, соответствующего внешнему шуму, на основе внутреннего признака сигнала и предварительно заданной формулы отображения, преобразования внешнего признака аппроксимации в оценку шумового сигнала обратным преобразованием Фурье и выполнения предварительно заданного процесса подавления шума по оценке шумового сигнала и воспринятому речевом сигналу, содержащему внутренний шум, для получения свободного от шумов речевого сигнала с подавленным шумом.

[0140] Главный механизм 52 восприятия речи выполнен с возможностью восприятия речевого сигнала, содержащего внутренний шум. Главный механизм 52 восприятия речи дополнительно выполнен с возможностью восприятия внешнего шума при условии отсутствия введенного речевого сигнала, так что устройство 53 подавления шума обучает, при условии отсутствия введенного речевого сигнала, предварительно заданную структуру автоматически кодирующей нейросети с помощью выборок шумового сигнала, состоящих из внутреннего шума и внешнего шума, для определения формулы отображения.

[0141] Внутренний признак сигнала является последовательностью кадров энергетического спектра, и внешний признак аппроксимации является последовательностью кадров в форме энергетического спектра.

[0142] Дополнительно контрольный механизм 51 восприятия речи и главный механизм 52 восприятия речи могут быть микрофонами, которые не ограничиваются здесь.

[0143] Специалистам в данной области техники должно быть четко понятно, что для удобного и ясного описания применительно к работе вышеупомянутых системы, устройства и блока ссылка может быть сделана на соответствующий процесс в приведенном выше варианте осуществления способа, который не повторяется здесь.

[0144] В вариантах осуществления, упомянутых в описании, должно быть понятно, что описываемые система, устройство или способ могут быть реализованы разными путями. Например, приведенный выше вариант осуществления устройства является только иллюстративным. Например, разделение на блоки является только логическим функциональным разделением. На практике могут быть другие разделения. Например, многие блоки или узлы могут объединяться или могут интегрироваться в другую систему. Альтернативно некоторые признаки могут опускаться или не выполняться. Показанные или обсуждаемые взаимные соединения или же прямые соединения или коммуникационные соединения могут быть непрямыми соединениями или коммуникационными соединениями через некоторые интерфейсы, устройства или блоки, которые могут быть в электрической, механической или другой форме.

[0145] Блоки, описанные как отдельные компоненты, могут быть или могут не быть отдельными физическими блоками, и компонент, показанный как блок, может быть или может не быть физическим блоком, то есть может быть расположен в одной и той же позиции или может быть распределен по многим сетевым блокам. Некоторые или все блоки могут быть выбраны, как требуется для реализации решения в варианте осуществления.

[0146] Дополнительно функциональные блоки в вариантах осуществления изобретения могут быть интегрированы в один процессинговый блок или могут быть реализованы как отдельные физические блоки. Один или более блоков могут быть интегрированы в один блок. Вышеупомянутый интегрированный блок может быть реализован в аппаратном оборудовании или может быть реализован как функциональный блок программного обеспечения.

[0147] При реализации в виде функционального блока программного обеспечения, и продаже и использовании в качестве отдельного продукта, интегрированный блок может храниться в машиночитаемом носителе информации. Основываясь на этом, существенная часть или часть, способствующая предшествующему уровню технического решения изобретения, или же всему или части технического решения, может быть реализована в виде программного продукта, который хранится в носителе информации, включая в себя несколько команд, заставляющих компьютерное устройство (которое может быть персональным компьютером, сервером, сетевым устройством, и т.п.) выполнять все или некоторые этапы способа в варианте осуществления изобретения. Носитель информации включает в себя различные среды, способные к запоминанию программного кода, такие как U-диск, подвижный диск, постоянное запоминающее устройство (ROM), оперативное запоминающее устройство (RAM), магнитный диск и оптический диск.

[0148] Как было сказано ранее, приведенные выше варианты осуществления служат только для описания технических решений изобретения, но не ограничивают объем изобретения. Хотя изобретение описано подробно со ссылкой на приведенные выше варианты осуществления, специалистам в данной области техники должно быть понятно, что могут быть произведены изменения применительно к некоторым или всем его техническим признакам. Такие изменения и эквиваленты не позволят соответствующим техническим решениям отклоняться от объема технических решений в вариантах осуществления настоящего изобретения.

1. Способ подавления шума, содержащий:

этап S1, на котором принимают устройством подавления шума внутренний шум, воспринятый контрольным механизмом восприятия речи, и речевой сигнал, содержащий внешний шум, воспринятый главным механизмом восприятия речи, когда вводится речевой сигнал;

этап S2, на котором извлекают внутренний признак сигнала, соответствующий внутреннему шуму, при этом внутренний признак сигнала является последовательностью кадров энергетического спектра;

этап S3, на котором вычисляют внешний признак аппроксимации, соответствующий внешнему шуму, на основе внутреннего признака сигнала и предварительно заданной формулы отображения, при этом внешний признак аппроксимации является последовательностью кадров в форме энергетического спектра;

этап S4, на котором преобразуют внешний признак аппроксимации в оценку шумового сигнала обратным преобразованием Фурье; и

этап S5, на котором выполняют предварительно заданный процесс подавления шума по оценке шумового сигнала и воспринятому речевому сигналу, содержащему внешний шум, для получения свободного от шумов речевого сигнала с подавленным шумом.

2. Способ подавления шума по п. 1, в котором перед этапом S1 способ дополнительно содержит этап, на котором:

обучают, при условии отсутствия введенного речевого сигнала, предварительно заданную структуру автоматически кодирующей нейросети с помощью выборок шумового сигнала, состоящих из внутреннего шума и внешнего шума, для определения упомянутой формулы отображения.

3. Способ подавления шума по п. 2, в котором обучение структуры автоматически кодирующей нейросети содержит:

этап S6, на котором выполняют преобразование Фурье применительно к каждому предварительно заданному кадру каждой из выборок шумового сигнала для получения признака и угловой информации выборки для кадра выборки, при этом признак кадра выборки представляется в форме энергетического спектра;

этап S7, на котором определяют обучающий набор выборок , используя признак кадра выборки в качестве входа x(n) выборки и ожидаемого выхода o(n) предварительно заданной структуры автоматически кодирующей нейросети;

этап S8, на котором выполняют обучение с помощью каждой обучающей выборки в обучающем наборе выборок для определения весового вектора и параметра смещения, соответствующих обучающему набору выборок ; и

этап S9, на котором добавляют упомянутый определенный весовой вектор и упомянутый определенный параметр смещения в предварительно заданную структуру автоматически кодирующей нейросети для получения упомянутой формулы отображения для обучающего набора выборок .

4. Способ подавления шума по любому из пп. 1-3, в котором этап S5 содержит этап, на котором:

выполняют ANC процесс подавления шума по оценке шумового сигнала и воспринятому речевому сигналу, содержащему внешний шум, для получения свободного от шумов речевого сигнала с подавленным шумом.

5. Способ подавления шума по п. 2 или 3, в котором предварительно заданная структура автоматически кодирующей нейросети является структурой с 5 уровнями, причем первый уровень и пятый уровень являются входным и выходным уровнями, а второй уровень, третий уровень и четвертый уровень являются скрытыми уровнями.

6. Устройство подавления шума, содержащее:

приемный блок, выполненный с возможностью приема внутреннего шума, воспринятого контрольным механизмом восприятия речи, и речевого сигнала, содержащего внешний шум, воспринятый главным механизмом восприятия речи, когда вводится речевой сигнал;

извлекающий блок, выполненный с возможностью извлечения внутреннего признака сигнала, соответствующего внутреннему шуму, причем внутренний признак сигнала является последовательностью кадров энергетического спектра;

получающий блок, выполненный с возможностью вычисления внешнего признака аппроксимации, соответствующего внешнему шуму, на основе внутреннего признака сигнала и предварительно заданной формулы отображения, причем внешний признак аппроксимации является последовательностью кадров в форме энергетического спектра;

преобразующий блок, выполненный с возможностью преобразования внешнего признака аппроксимации в оценку шумового сигнала обратным преобразованием Фурье; и

блок устранения шума, выполненный с возможностью выполнения предварительно заданного процесса подавления шума по оценке шумового сигнала и воспринятому речевому сигналу, содержащему внешний шум, для получения свободного от шумов речевого сигнала с подавленным шумом.

7. Устройство подавления шума по п. 6, причем устройство подавления шума дополнительно содержит:

обучающий блок, выполненный с возможностью обучения, при условии отсутствия введенного речевого сигнала, предварительно заданной структуры автоматически кодирующей нейросети с помощью выборок шумового сигнала, состоящих из внутреннего шума и внешнего шума, для определения упомянутой формулы отображения.

8. Устройство подавления шума по п. 7, в котором обучающий блок содержит:

преобразующий подблок, выполненный с возможностью выполнения, при условии отсутствия введенного речевого сигнала, преобразования Фурье применительно к каждому предварительно заданному кадру каждой из выборок шумового сигнала для получения признака и угловой информации выборки для кадра выборки, причем признак кадра выборки представляется в форме энергетического спектра;

первый определяющий подблок, выполненный с возможностью определения обучающего набора выборок с использованием признака кадра выборки в качестве входа x(n) выборки и ожидаемого выхода o(n) предварительно заданной структуры автоматически кодирующей нейросети;

второй определяющий подблок, выполненный с возможностью выполнения обучения с помощью каждой обучающей выборки из обучающего набора выборок для определения весового вектора и параметра смещения, соответствующих обучающему набору выборок ; и

вычислительный подблок, выполненный с возможностью добавления упомянутого определенного весового вектора и упомянутого определенного параметра смещения в предварительно заданную структуру автоматически кодирующей нейросети для получения упомянутой формулы отображения для обучающего набора выборок .

9. Система подавления шума, содержащая:

контрольный механизм восприятия речи;

главный механизм восприятия речи;

устройство подавления шума по любому из пп. 6-8; причем

контрольный механизм восприятия речи и главный механизм восприятия речи находятся в соединении для передачи сигналов с устройством подавления шума;

контрольный механизм восприятия речи выполнен с возможностью восприятия внутреннего шумового сигнала;

устройство подавления шума выполнено с возможностью приема внутреннего шума и речевого сигнала, содержащего внешний шум, когда вводится речевой сигнал, извлечения внутреннего признака сигнала, соответствующего внутреннему шуму, вычисления внешнего признака аппроксимации, соответствующего вешнему шуму, на основе внутреннего признака сигнала и предварительно заданной формулы отображения, преобразования внешнего признака аппроксимации в оценку шумового сигнала обратным преобразованием Фурье и выполнения предварительно заданного процесса подавления шума по оценке шумового сигнала и воспринятому речевому сигналу, содержащему внешний шум, для получения свободного от шумов речевого сигнала с подавленным шумом;

главный механизм восприятия речи выполнен с возможностью восприятия речевого сигнала, содержащего внешний шум; и

внутренний признак сигнала является последовательностью кадров энергетического спектра, и внешний признак аппроксимации является последовательностью кадров в форме энергетического спектра.

10. Система подавления шума по п. 9, в которой:

главный механизм восприятия речи дополнительно выполнен с возможностью восприятия внешнего шума при условии отсутствия введенного речевого сигнала, и при этом устройство подавления шума обучает, при условии отсутствия введенного речевого сигнала, предварительно заданную структуру автоматически кодирующей нейросети с помощью выборок шумового сигнала, состоящих из внутреннего шума и внешнего шума, для определения упомянутой формулы отображения.

Изобретение относится к средствам для получения кадра модификации речевой активности. Технический результат заключается в повышении эффективности обработки речевых сигналов.

Улучшенное расширение диапазона частот в декодере звукового сигнала // 2682923

Изобретение относится к области обработки звуковых сигналов. Технический результат заключается в повышении качества обработки звукового сигнала при расширении частотного диапазона звукового сигнала.

Усовершенствованная коррекция потери кадров с помощью речевой информации // 2682851

Изобретение относится к вычислительной технике для обработки цифрового аудиосигнала. Технический результат заключается в повышении качества аудиосигнала после коррекции потери кадра.

Идентификация контактов с использованием распознавания речи // 2682005

Изобретение относится к области вычислительной техники для обработки голоса. Технический результат заключается в повышении точности идентификации голосовых команд пользователя.

Выровненное по фрагменту аудиокодирование // 2681958

Изобретение относится к аудиокодеку для использования параллельно с кодированным видео. Техническим результатом является обеспечение синхронизации и выравнивания аудио и видео.

Способ разделения речи и пауз путем анализа значений фаз частотных составляющих шума и сигнала // 2680735

Изобретение относится к области техники передачи и трансляции речевой информации. Технический результат заключается в повышении точности определения момента появления и увеличении значения вероятности правильного решения о появлении речевого сигнала при наличии акустического шума.

Способ и устройство обнаружения голосовой активности // 2680351

Изобретение относится к обнаружению голосовой активности (VAD). Технический результат – увеличение точности обнаружения кадров речевой неактивности до и после голосовых сегментов.

Устройство и способ для обработки аудиосигнала для получения обработанного аудиосигнала с использованием целевой огибающей во временной области // 2679254

Изобретение относится к средствам для обработки аудиосигнала. Технический результат заключается в повышении эффективности обработки аудиосигнала.

Аудиодекодер и способ обеспечения декодированной аудиоинформации с использованием маскирования ошибки на основании сигнала возбуждения во временной области // 2678473

Изобретение относится к области декодирования аудиоинформации. Технический результат – обеспечение улучшенного маскирования ошибки аудиоинформации.

Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора // 2676870

Изобретение относится к средствам для кодирования и декодирования аудиосигнала. Технический результат заключается в создании усовершенствованной концепции кодирования/декодирования аудиоданных, позволяющей уменьшить скорость передачи дополнительной информации для схемы направленного декодирования.

Улучшенное расширение диапазона частот в декодере звукового сигнала // 2682923

Способ разделения речи и пауз путем анализа значений фаз частотных составляющих шума и сигнала // 2680735

Способ и устройство обнаружения голосовой активности // 2680351

Аудиокодер для кодирования многоканального сигнала и аудиодекодер для декодирования кодированного аудиосигнала // 2680195

Изобретение относится к средствам для кодирования многоканального аудиосигнала. Технический результат заключается в повышении эффективности кодирования аудиосигнала.

Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи // 2679973

Изобретение относится к средствам для кодирования и декодирования речи. Технический результат заключается в уменьшении опережающего и запаздывающего эха.

Аудиокодер для кодирования многоканального сигнала и аудиодекодер для декодирования кодированного аудиосигнала // 2679571

Изобретение относится к средствам для кодирования и декодирования многоканального аудиосигнала. Технический результат заключается в повышении эффективности обработки аудиосигнала.

Способ, аппарат, устройство, компьютерно-читаемый носитель для расширения полосы частот аудиосигнала с использованием масштабируемого возбуждения верхней полосы // 2679346

Изобретение относится к средствам для обработки сигналов. Технический результат заключается в повышении эффективности обработки сигнала за счет уменьшения динамического диапазона информации об усилении, предоставленной кодеру.

Способ и устройство для декодирования амбиофонического аудиопредставления звукового поля для проигрывания аудио с использованием 2d-компоновок // 2679230

Изобретение относится к средствам для декодирования аудиопредставления звукового поля. Технический результат заключается в повышении качества локализации звука.

Потоки данных элементов аудиовизуального контента // 2678323

Изобретение относится к обработке потока данных элементов аудиовизуального контента и, в частности, аудиовизуального контента транспортного потока MPEG-2. Техническим результатом является обеспечение улучшенного и более гибкого потока данных для аудиовизуального контента.

Устройство и способ для расширения диапазона частот для акустических сигналов // 2688247

Изобретение относится к средствам для расширения диапазона частот для акустических сигналов. Технический результат заключается в повышении эффективности расширения диапазона частот входных сигналов для повышения качества аудио. Демультиплексируют параметры кодирования, индексную информацию, идентифицирующую наиболее коррелированную часть из низкочастотного спектра для одного или более высокочастотных поддиапазонов, и информацию коэффициентов масштаба из кодированной информации, переданной от устройства кодирования, которое кодирует аудиосигнал. Дублируют спектр высокочастотного поддиапазона на основании индексной информации, используя синтезированный низкочастотный спектр, причем синтезированный низкочастотный спектр получен декодированием параметров кодирования. Регулируют амплитуды дублированного спектра высокочастотного поддиапазона, используя информацию коэффициентов масштаба. Оценивают частоты гармонической составляющей в синтезированном низкочастотном спектре. Регулируют частоты гармонической составляющей в спектре высокочастотного поддиапазона, используя оцененный спектр гармонической частоты. 2 н. и 6 з.п. ф-лы, 14 ил.