Активируемое голосом преобразование звука для головных гарнитур с использованием представления сигналов микрофона в частотной области

Авторы патента:

АПЕЛКВИСТ, Стефан М. (SE)

ГИДЛА, Виджай К. (SE)

МАНГАМ, Абель Гладстон (SE)

КИЛЬБЕРГ, Роджер (SE)

G10L25/78 - Анализирование или синтезирование речи; распознавание речи (ввод/вывод звука для компьютеров G06F 3/16; способы или устройства для обработки цифровых данных, специально предназначенных для манипулирования данными на естественном языке G06F 17/20; обучение или общение со слепыми, глухими или немыми G09B 21/00; телефонная связь H04M)

Владельцы патента RU 2756385:

3М ИННОВЕЙТИВ ПРОПЕРТИЗ КОМПАНИ (US)

Заявленная группа изобретений относится к активируемому голосом преобразованию звука для головных гарнитур с применением представления сигналов микрофона в частотной области, что может быть особенно подходящим для применений, относящихся к защите органов слуха. Способ активируемого голосом преобразования включает определение параметра мощности голоса на основании представления в частотной области голосового сигнала, поступающего от голосового микрофона. Способ также включает определение параметра внешней мощности на основании представления в частотной области по меньшей мере одного внешнего сигнала, поступающего по меньшей мере от одного внешнего микрофона, пространственно разнесенного с голосовым микрофоном. Способ также включает запуск преобразования аудиосигнала на основании голосового сигнала в ответ на сравнение параметров мощности и порогового значения. В головной гарнитуре, содержащей контроллер, может быть применен способ для определения того, включать или выключать преобразование, передачу или и то и другое аудиосигнала на другое устройство. За счет исключения необходимости в переноске дополнительного оборудования для связи вес оборудования для связи, переносимого пользователем, может быть уменьшен, тем самым увеличивая диапазон передвижения и/или перемещения пользователя. Обеспечение точного обнаружения голоса пользователя в шумной окружающей среде может улучшить связь с другими людьми. Кроме того, точное обнаружение голоса может способствовать улучшенному энергосбережению батареи и увеличению времени между зарядками путем отключения определенных функций, когда пользователь не разговаривает. 3 н. и 17 з.п. ф-лы, 1 табл., 11 ил.

[0001] Шумные окружающие среды, такие как рабочие участки, аэродромы, вертолетные площадки и т.п., могут включать источники шума, которые могут привести к повреждению органов слуха человека. У человека, работающего в шумной окружающей среде, может наблюдаться потеря слуха из-за острой акустической травмы или постепенно развивающаяся потеря слуха, вызванная шумом. Для способствования предотвращению повреждения органов слуха человек, работающий в шумной окружающей среде, может надеть средство защиты органов слуха. Средство защиты органов слуха может быть пассивным или активным. Пассивное средство защиты органов слуха может включать использование берушей и наушников, которые блокируют шум вплоть до конкретного уровня шума. Активное средство защиты органов слуха может включать использование наушников, которые позволяют определенным типам шума проходить через них к человеку за счет электронной фильтрации конкретных децибелов или частот.

[0002] Хотя различные формы средства защиты органов слуха могут обеспечивать надлежащий уровень защиты от чрезмерного шума, люди, на которых надеты такие средства защиты органов слуха, могут нуждаться в связи друг с другом. В шумных окружающих средах связь друг с другом может быть трудной при надетом средстве защиты органов слуха из-за шума от источников шума и фильтрации, осуществляемой средством защиты органов слуха. В некоторых случаях человек, на которого надето средство защиты органов слуха, может нести дополнительное и отдельное устройство связи, способствующее осуществлению связи с другими лицами в шумной окружающей среде. Хотя отдельные устройства связи могут способствовать осуществлению такой связи, человеку может потребоваться нести два отдельных устройства (средство защиты органов слуха и устройство связи).

[0003] Управляемый голосом переключатель (VOX) используется для обеспечения голосовой связи между головными гарнитурами. Как правило, VOX передает звук на другую головную гарнитуру при обнаружении голосовой активности. Однако традиционное обнаружение голосовой активности в существующих головных гарнитурах с поддержкой VOX может не работать корректно в окружающих средах с высоким уровнем шума или в окружающих средах с нестационарным шумом. В частности, традиционные алгоритмы обнаружения голосовой активности испытывают затруднения при различении речи от шума в громкой окружающей среде и непрерывно преобразуют и передают звук, даже когда речи нет. Это может привести к сокращению срока службы батареи между зарядками и плохой четкости при общении с другими людьми, что означает, что традиционное обнаружение голосовой активности может быть непригодным для использования с головными гарнитурами для защиты органов слуха в некоторых окружающих средах.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0004] Различные аспекты настоящей заявки относятся к активируемому голосом преобразованию звука для головных гарнитур с применением представления сигналов микрофона в частотной области, что может быть особенно подходящим для применений, относящихся к защите органов слуха. Активируемое голосом преобразование звука может включать использование сигналов, поступающих по меньшей мере от двух микрофонов, таких как голосовой микрофон и внешний микрофон. Сигналы микрофона могут быть преобразованы в представления в частотной области, при этом мощность сигналов может сравниваться в одном или нескольких выбранных частотных диапазонах. Голосовая активация может быть определена на основании указанного сравнения. Выбор частотных диапазонов, которые соответствуют речи, а также использование относительного сравнения сигналов может обеспечить надежное обнаружение голосовой активности или функциональность VOX в окружающих средах с высоким уровнем шума или в окружающих средах с нестационарным шумом. Использование такого способа активируемого голосом преобразования звука может привести к повышению энергосбережения и более желательным характеристикам коммуникационной головной гарнитуры в сферах применения по защите органов слуха.

[0005] В одном аспекте устройство может содержать голосовой микрофон, выполненный с возможностью генерирования голосового сигнала на основании звука, обнаруженного вблизи голосового микрофона. Устройство может содержать по меньшей мере один внешний микрофон, пространственно разнесенный с голосовым микрофоном, и выполненный с возможностью генерирования по меньшей мере одного внешнего сигнала на основании звука, обнаруженного вблизи указанного по меньшей мере одного внешнего микрофона. Устройство может дополнительно содержать контроллер, функционально связанный с микрофонами. Контроллер может содержать преобразователь сообщений, выполненный с возможностью преобразования аудиосигнала для передачи на другое устройство. Контроллер может быть выполнен с возможностью определения параметра мощности голоса на основании представления в частотной области голосового сигнала. Контроллер также может быть выполнен с возможностью определения параметра внешней мощности на основании представления в частотной области указанного по меньшей мере одного внешнего сигнала. Контроллер может быть дополнительно выполнен с возможностью преобразования аудиосигнала на основании голосового сигнала с использованием преобразователя сообщений в ответ на определение, которое основано по меньшей мере частично на параметрах мощности и пороговом значении.

[0006] В другом аспекте контроллер может содержать интерфейс ввода, выполненный с возможностью приема голосового сигнала и по меньшей мере одного внешнего сигнала. Контроллер может также содержать интерфейс вывода, выполненный с возможностью обеспечения аудиосигнала на основании голосового сигнала. Контроллер может дополнительно содержать запоминающее устройство, выполненное с возможностью хранения представления голосового сигнала и внешнего сигнала. Кроме того, контроллер может содержать процессор, функционально связанный с интерфейсом ввода, интерфейсом вывода и запоминающим устройством. Процессор может быть выполнен с возможностью определения параметра мощности голоса на основании представления в частотной области голосового сигнала. Процессор также может быть выполнен с возможностью определения параметра внешней мощности на основании представления в частотной области указанного по меньшей мере одного внешнего сигнала. Процессор может быть дополнительно выполнен с возможностью преобразования аудиосигнала на основании голосового сигнала в ответ на определение, которое основано по меньшей мере частично на параметрах мощности и пороговом значении.

[0007] В другом аспекте способ может включать определение параметра мощности голоса на основании представления в частотной области голосового сигнала, поступающего от голосового микрофона. Способ может также включать определение параметра внешней мощности на основании представления в частотной области по меньшей мере одного внешнего сигнала, поступающего по меньшей мере от одного внешнего микрофона, пространственно разнесенного с голосовым микрофоном. Способ может дополнительно включать преобразование аудиосигнала с использованием микропроцессора на основании голосового сигнала в ответ на определение, основанное по меньшей мере частично на параметрах мощности и пороговом значении.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0008] Чертежи этой заявки могут быть кратко описаны следующим образом:

[0009] Фиг. 1 - изображение головной гарнитуры в соответствии с одним воплощением настоящей заявки.

[0010] Фиг. 2 - блок-схема одного из способов активируемого голосом преобразования для использования с головной гарнитурой согласно фиг. 1 в соответствии с одним воплощением настоящей заявки.

[0011] Фиг. 3 - схематическое изображение контроллера для использования с головной гарнитурой согласно фиг. 1 в соответствии с одним воплощением настоящей заявки.

[0012] Фиг. 4 - схематическое изображение запоминающего устройства, хранящего данные в контроллере согласно фиг. 3 в соответствии с одним воплощением настоящей заявки.

[0013] Фиг. 5 - блок-схема другого способа активируемого голосом преобразования для использования с головной гарнитурой согласно фиг. 1 в соответствии с одним воплощением настоящей заявки.

[0014] Фиг. 6 - блок-схема одного из способов принятия решения касательно того, обнаружен ли голос для использования в соответствии со способом согласно фиг. 5 в соответствии с одним воплощением настоящей заявки.

[0015] Фиг. 7 - блок-схема другого способа принятия решения касательно того, обнаружен ли голос для использования в соответствии со способом согласно фиг. 5 в соответствии с одним воплощением настоящей заявки.

[0016] Фиг. 8 - блок-схема одного из способов улучшения аудио для использования в соответствии со способом согласно фиг. 5 в соответствии с одним воплощением настоящей заявки.

[0017] Фиг. 9 - график, на котором показана работа алгоритма VOX для ввода речевого сигнала.

[0018] Фиг. 10 - график, на котором показана работа двух алгоритмов VOX для сигнала «речь плюс шум вертолета».

[0019] Фиг. 11 - график, на котором показана работа двух алгоритмов VOX для сигнала «речь плюс розовый шум».

ПОДРОБНОЕ ОПИСАНИЕ

[0020] Настоящая заявка относится к головным гарнитурам. В частности, настоящая заявка относится к активируемому голосом преобразованию звука для головных гарнитур с применением представления сигналов микрофона в частотной области для повышения энергосбережения и улучшения рабочих характеристик в шумных окружающих средах. Хотя упоминаются головные гарнитуры, такие как коммуникационные головные гарнитуры для защиты органов слуха, способ активируемого голосом преобразования звука, описанный в настоящем документе, может быть использован с любым устройством, которое принимает два разных типа шума от разных микрофонов, таким как подвижная радиостанция с внутренним и внешним микрофонами. Различные другие применения станут очевидны для специалиста в данной области, у которого есть доступ к описанию настоящей заявки.

[0021] За счет исключения необходимости в переноске дополнительного оборудования для связи вес оборудования для связи, переносимого пользователем, может быть уменьшен, тем самым увеличивая диапазон передвижения и/или перемещения пользователя. Обеспечение точного обнаружения голоса пользователя в шумной окружающей среде может улучшить связь с другими людьми. Кроме того, точное обнаружение голоса может способствовать улучшенному энергосбережению батареи и увеличению времени между зарядками (например, меньшее время перезарядки и/или время простоя) путем отключения определенных функций, когда пользователь не разговаривает. Более того, обеспечение точного обнаружения голоса, несмотря на ограниченное пространство между микрофонами, может способствовать улучшению характеристик, характерных для головных гарнитур, используемых в сферах применения по защите органов слуха.

[0022] Настоящая заявка обеспечивает активируемое голосом преобразование звука, которое может применяться в различных способах, системах и устройствах, связанных с обеспечением связи между головными гарнитурами. В головных гарнитурах для голосовой связи способ активируемого голосом преобразования звука может включать определение параметра мощности голоса на основании представления в частотной области голосового сигнала, поступающего с голосового микрофона; определение параметра внешней мощности на основании представления в частотной области по меньшей мере одного внешнего сигнала, поступающего по меньшей мере с одного внешнего микрофона, пространственно разнесенного с голосовым микрофоном; и преобразование аудиосигнала на основании голосового сигнала в ответ на определение, основанное по меньшей мере частично на параметрах мощности и пороговом значении. Преобразование может быть отключено в ответ на сравнение параметров мощности и порогового значения отключения, которое может быть таким же или отличаться от указанного порогового значения. Указанные одно или оба пороговых значения могут быть определены, например, с использованием метода проб и ошибок. В частности, сравнение параметров мощности в одном или более выбранных частотных диапазонах может включать определение соотношения между параметрами мощности. Относительное сравнение параметров мощности в одном или боле выбранных частотных диапазонах может обеспечить возможность надежного обнаружения голосовой активности с использованием простого порога. Например, соотношение может сравниваться с пороговым значением. Представление сигналов микрофона в частотной области также может быть использовано для обеспечения улучшенного аудиосигнала, который может быть преобразован и передан головной гарнитурой. Представление в частотной области может быть использовано в качестве входных данных в алгоритме шумоподавления для обеспечения улучшенного аудиосигнала.

[0023] Чертежи настоящей заявки, на которых показаны один или более аспектов раскрытия настоящей заявки, описаны в настоящем документе более подробно. Следует понимать, что другие аспекты, не изображенные на чертежах или явно описанные в данном документе, могут рассматриваться в пределах объема этого раскрытия, например, при рассмотрении специалистом в данной области техники.

[0024] На фиг. 1 показана окружающая среда 100 для применения коммуникационной головной гарнитуры 102, которая может использоваться человеком или пользователем 104 для защиты органов слуха. Головная гарнитура 102 содержит один или более микрофонов. Каждый микрофон 106, 108, 110 может быть описан как устройство, которое преобразует звук в сигнал (например, электрический сигнал), представляющий обнаруженный сигнал. Например, пользователь 104, носящий головную гарнитуру 102, может говорить, тем самым генерирую звук, который принимается одним из микрофонов. Сигналы от одного или более микрофонов 106, 108, 110 могут быть использованы для определения того, был ли обнаружен голос пользователя.

[0025] Как показано, головная гарнитура 102 содержит голосовой микрофон 106 (например, микрофон на штанге), первый внешний микрофон 108 (например, вблизи правого уха) и второй внешний микрофон 110 (например, вблизи левого уха). Голосовой микрофон 106 может быть описан как обеспечивающий голосовой сигнал, и при этом каждый внешний микрофон 108, 110 может быть описан как обеспечивающий внешний сигнал. Каждый микрофон 106, 108, 110 может быть пространственно разнесен по меньшей мере с одним из других микрофонов в любом направлении. Каждый микрофон 106, 108, 110 может характеризоваться наличием эффекта направленности и близости, что может быть использовано для фильтрации низких частот на одном или более расстояниях (например, за пределами определенного расстояния). Например, голосовой микрофон 106 может характеризоваться гиперкардиоидной диаграммой направленности, которая может давать максимальный отклик при ориентации 0 градусов (например, при направлении в рот пользователя 104). Частотная характеристика голосового микрофона 106 может отличаться от внешних микрофонов 108, 110. Внешние микрофоны 108, 110 могут характеризоваться направленностью, отличающейся от направленности голосового микрофона 106, например, всенаправленной. Частотная характеристика внешних микрофонов 108, 110 может характеризоваться по существу одинаковой величиной во всех или практически во всех направлениях и/или частотах.

[0026] Как показано, головная гарнитура 102 содержит первый ушной аппарат 114 и второй ушной аппарат 116. Ушные аппараты 114, 116 могут быть соединены посредством оголовья 118 (например, дужки), протяженного между ушными аппаратами. Оголовье 118 может быть сформировано из любого жесткого или полужесткого материала, такого как пластмасса, алюминий, сталь или любой другой подходящий материал. Оголовье 118 может применяться для фиксации головной гарнитуры 102 на голове пользователя. В некоторых воплощениях оголовье 118 может быть использовано для пространственного разнесения первого и второго внешних микрофонов 108, 110 друг от друга.

[0027] Каждый ушной аппарат 114, 116 может содержать в себе или может быть прикреплен к одному из внешних микрофонов 108, 110. В показанном воплощении первый ушной аппарат 114 содержит первый внешний микрофон 108, а второй ушной аппарат 116 содержит второй внешний микрофон 110.

[0028] Каждый из микрофонов 106, 108, 110 может быть функционально связан с контроллером 112 по беспроводному или проводному соединению, например, с использованием межсоединения. Примеры межсоединения, обеспечивающего проводную связь между различными компонентами головной гарнитуры 102, включают в себя одну или несколько жил проводов, выполненных из меди, алюминия, серебра или другого подходящего проводящего материала. Некоторое межсоединение может быть связано с оголовьем 118, например, для обеспечения соединения между ушным аппаратом 114 и ушным аппаратом 116.

[0029] Контроллер 112 может использоваться для определения того, обнаружен ли голос пользователя на основании сигналов от одного или более микрофонов 106, 108, 110. Как показано, контроллер 112 расположен во втором ушном аппарате 116. В целом, некоторые или все из контроллеров 112 могут быть связаны с первым ушным аппаратом 114, вторым ушным аппаратом 116, оголовьем 118 или любой их комбинацией.

[0030] Головная гарнитура 102 может содержать одну или более антенн, таких как антенна 120, предназначенных для передачи и/или приема сигналов от других устройств, удаленных относительно головной гарнитуры. Как показано, антенна 120 выполнена протяженной от ушного аппарата 114. Антенна 120 может быть функционально связана с контроллером 112 по беспроводному или проводному соединению, например, с использованием межсоединения. В целом, некоторые или все из антенн 120 могут быть связаны с первым ушным аппаратом 114, вторым ушным аппаратом 116, оголовьем 118 или любой их комбинацией.

[0031] Микрофон 106 может быть связан со штангой 122, которая может осуществлять позиционирование голосового микрофона 106 вблизи рта пользователя. Как показано, штанга 122 выполнена протяженной от второго ушного аппарата 116. В целом, штанга 122 может быть связана с первым ушным аппаратом 114, вторым ушным аппаратом 116, оголовьем 118 или любой их комбинацией. В некоторых воплощениях штанга 122 может применяться для пространственного разнесения голосового микрофона 106 с одним или обоими внешними микрофонами 108, 110.

[0032] Ушные аппараты 114, 116 могут быть спроектированы так, чтобы обеспечивать по меньшей мере некоторую пассивную или активную защиту органов слуха пользователя 104. Каждый ушной аппарат 114, 116 может содержать амбушюру 124, связанную с частью 126 в виде чашки ушного аппарата. В частности, каждая амбушюра 124 и часть 126 в виде чашки могут формировать акустический барьер вокруг каждого уха пользователя 104. Амбушюры 124 могут прилегать вокруг ушей пользователя 104. Амбушюры 124 могут вносить вклад в способность ушных аппаратов 114, 116 гасить или иным образом ослаблять окружающий звук из окружающей среды за пределами ушных аппаратов. Амбушюры 124 могут быть выполнены из любого сжимаемого и/или расширяемого материала, такого как пеноматериал, гель, воздух, или любой другой подобный подходящий материал. Части 126 в виде чашек могут быть выполнены из любого жесткого или полужесткого материала, такого как пластмасса, который в некоторых случаях может представлять собой непроводящую, диэлектрическую пластмассу.

[0033] Каждая часть 126 в виде чашки может содержать динамик (не показан), такой как громкоговоритель, для излучения звука, соответствующего сигналу (например, электрическому сигналу). В частности, каждая часть 126 в виде чашки с динамиком может быть расположена таким образом, чтобы направлять звук во внутреннее пространство чашки, образованное указанной частью в виде чашки. При использовании головной гарнитуры 102 внутреннее пространство каждой части 126 в виде чашки может быть расположено вблизи уха пользователя 104. Каждый динамик может излучать звук на основании сигнала, полученного или сгенерированного другими компонентами головной гарнитуры 102, такими как контроллер 112. В частности, каждый динамик может быть функционально связан с контроллером 112 по беспроводному или проводному соединению, например, с использованием межсоединения, которое может быть связано с оголовьем 118. Каждый динамик может содержать один или более электроакустических преобразователей, которые преобразуют электрические аудиосигналы в звук. Некоторые динамики могут содержать одно или более из магнита, звуковой катушки, подвески и конструкции в виде диафрагмы или мембраны.

[0034] Один или более из компонентов, таких как контроллеры, микрофоны или динамики, как описано в настоящем документе, могут содержать процессор, такой как центральный процессор (CPU), компьютер, логический массив или другое устройство, выполненное с возможностью направления данных, поступающих в головную гарнитуру 102 или из нее. Контроллер может содержать одно или более устройств для обработки данных, содержащих запоминающее устройство, а также аппаратное обеспечение для обработки и связи. Контроллер может содержать схему, используемую для соединения различных компонентов контроллера вместе или с другими компонентами, функционально связанными с контроллером. Функции контроллера могут выполняться аппаратным обеспечением и/или в виде компьютерных команд на постоянном машиночитаемом запоминающем носителе.

[0035] Процессор контроллера может содержать одно или более из микропроцессора, микроконтроллера, процессора цифровой обработки сигналов (DSP), специализированной интегральной схемы (ASIC), программируемой пользователем вентильной матрицы (FPGA) и/или эквивалентной дискретной или интегрированной логической схемы. В некоторых примерах процессор может содержать множество компонентов, например, любую комбинацию из одного или более микропроцессоров, одного или более контроллеров, одного или более DSP, одной или более ASIC, и/или одной или более FPGA, а также других дискретных или интегрированных логических схем. Функции, приписываемые контроллеру или процессору в данном документе, могут быть воплощены в виде программного обеспечения, программно-аппаратного обеспечения, аппаратного обеспечения или любой их комбинации. Не смотря на то, что в настоящем документе он описан в виде системы на основе процессора, в альтернативном контроллере для достижения желаемых результатов могут быть использованы другие компоненты, такие как реле и таймеры, либо отдельно, либо в комбинации с системой на основе микропроцессора.

[0036] В одном или более воплощениях приведенные в качестве примеров системы, способы и интерфейсы могут быть реализованы с использованием одной или более компьютерных программ, с использованием аппарата для обработки данных, который может содержать один или более процессоров и/или запоминающих устройств. Программный код и/или логика, описанные в настоящем документе, могут применяться для ввода данных/информации, чтобы выполнять описанные в настоящем документе функции и генерировать требуемые выходные данные/информацию. Выходные данные/информация могут применяться в качестве входных данных для одного или более других устройств и/или способов, как описано в настоящем документе, или как было бы применено известным способом. Принимая во внимание вышеизложенное, будет очевидно, что описанные в настоящем документе функциональные возможности контроллера могут быть реализованы любым способом, известным специалистам в данной области техники.

[0037] При описании различных компонентов головной гарнитуры 102 функциональные возможности активируемого голосом преобразования головной гарнитуры будут описаны в настоящем документе более подробно со ссылкой на фиг. 2.

[0038] На фиг. 2 показан пример блок-схемы способа 200 с высокоуровневой архитектурой, осуществляющего активируемое голосом преобразование, применимого к головной гарнитуре 102 (фиг. 1). Одна или более частей способа 200 могут быть выполнены с помощью компонентов контроллера 112 (фиг. 1). Способ 200 может включать аналогово-цифровое преобразование 202 сигналов микрофона, например, от голосового микрофона 106 и по меньшей мере от одного из первого внешнего микрофона 108 и второго внешнего микрофона 110. В целом, микрофоны 106, 108, 110 обеспечивают аналоговые сигналы, представляющие звук для обработки сигналов. Аналогово-цифровое преобразование 202 обеспечивает цифровое представление сигнала каждого микрофона. Аналогово-цифровое преобразование 202 может осуществляться посредством любого подходящего процессора, такого как аналогово-цифровой преобразователь (АЦП). Каждый микрофон 106, 108, 110 может быть функционально связан с отдельным АЦП или разными входами одного или более АЦП для выполнения аналогово-цифрового преобразования 202.

[0039] Сигналы микрофона могут приниматься для управления 204 вводом-выводом. Таким образом, сигналы микрофона могут подаваться или передаваться по маршруту в запоминающее устройство 206 данных. Сигналы микрофона могут приниматься от запоминающего устройства (например, процессором, таким как центральный процессор или CPU) для обработки 208 сигналов.

[0040] Обработка 208 сигналов может обеспечивать представление в частотной области сигнала каждого микрофона. Представление в частотной области обеспечивает информацию, такую как информация о величине и/или фазе, применительно к сигналу для одной или более частот или частотных диапазонов.

[0041] Обработка 208 сигналов может включать в себя осуществление цифровой обработки сигналов и/или аналоговой обработки сигналов (например, аналоговых сигналов микрофона без аналогово-цифрового преобразования 202) для обеспечения представления сигналов микрофона в частотной области. Например, может использоваться набор аналоговых фильтров.

[0042] Сигнал каждого микрофона может представлять звуковую энергию. Обработка 208 сигналов может обеспечивать параметр мощности для сигнала каждого микрофона на основании звуковой энергии. В частности, каждый параметр мощности может быть определен на основании представления в частотной области сигнала соответствующего микрофона в одном или более выбранных частотных диапазонах. Выбранные частотные диапазоны могут соответствовать частотам, характерным для речи. Сравнение параметров мощности в одном или более выбранных частотных диапазонах, соответствующих речи, может обеспечивать надежную изоляцию разговорных частот от различных частот окружающего шума, при которой преимущественно используется расположение голосового микрофона вблизи рта пользователя и внешнего микрофона, расположенного в отдалении.

[0043] Используя информацию, обеспеченную обработкой 208 сигналов, блок 210 принятия решения в отношении голоса может определить, следует ли включить или отключить преобразование голоса и/или передачу из головной гарнитуры 102. Когда блок 210 принятия решения в отношении голоса разрешает преобразование и/или передачу голоса, аудиосигнал, основанный на аналоговом или цифровом сигнале микрофона может быть подан на приемопередатчик 212 для передачи, например, на другую головную гарнитуру или другое устройство связи.

[0044] В целом, преобразование и передача аудиосигналов, основанных на сигналах микрофона, требует использования большего количества ресурсов обработки и/или энергии батареи, чем различная обработка 208 сигналов, описанная в настоящем документе. Использование обработки 208 сигналов и блока 210 принятия решения в отношении голоса может обеспечивать экономию ресурсов обработки и/или энергии батареи во время работы головной гарнитуры 102 для улучшения показателя времени между зарядками.

[0045] На фиг. 3 схематически показан один из примеров контроллера 300 для головной гарнитуры 102 (фиг. 1), выполненного с возможностью активируемого голосом преобразования. Как показано, контроллер 300 содержит интерфейс 302 ввода, который может быть функционально связан с одним или более из голосового микрофона 106, первого внешнего микрофона 108 и второго внешнего микрофона 110, и при этом может быть выполнен с возможностью приема одного или более сигналов микрофона. Контроллер 300 содержит интерфейс 304 вывода, который может быть функционально связан с приемопередатчиком 212, и при этом может быть выполнен с возможностью подачи аудиосигнала в приемопередатчик. Приемопередатчик 212 может содержать различные компоненты, беспроводным способом передавать и/или принимать сообщения, например, на другое устройство или от него, и при этом он может быть связан с антенной 120 или содержать ее (фиг. 1). В некоторых воплощениях приемопередатчик 212 может считаться частью контроллера 300.

[0046] Интерфейс 302 ввода и интерфейс 304 вывода могут быть функционально связаны с процессором 306 и/или запоминающим устройством 308. Процессор 306 может быть выполнен в виде одного или более модулей. Модули могут содержать аппаратное обеспечение (например, чип интегральной схемы) и/или программное обеспечение (например, команды, хранимые в запоминающем устройстве 308). Модули процессора 306 могут содержать аналогово-цифровой преобразователь (АЦП) 310, компенсатор 312, преобразователь 314, вычислитель 316 мощности, вычислитель 318 соотношения, компаратор 320, модуль 322 принятия решения в отношении голоса, модуль 324 улучшения, или преобразователь 326.

[0047] Процессор 306 может содержать АЦП 310. Как показано, АЦП 310 может принимать один или более аналоговых сигналов, представляющих звуки, обнаруженные микрофонами 106, 108, 110, и преобразовывать каждый аналоговый сигнал в цифровую форму (например, с использованием шестнадцатеричных цифр). Может использоваться любое подходящее разрешение, например, уровень разрешения 32-битного целого числа со знаком.

[0048] Результирующие цифровые сигналы от АЦП 310 могут подаваться на компенсатор 312. Каждый микрофон 106, 108, 110 может характеризоваться различной частотной характеристикой, в частности, если рассматривать между голосовым микрофоном 106 и внешними микрофонами 108, 110. Компенсатор 312 может корректировать один или более цифровых сигналов на основании отличий между различными частотными характеристиками микрофонов 106, 108, 110. В некоторых воплощениях компенсатор 312 корректирует цифровой сигнал от одного или обоих внешних микрофонов 108, 110 на основании отличий частотных характеристик, если сравнивать с голосовым микрофоном 106.

[0049] Преобразователь 314 может принимать один или более скомпенсированных цифровых сигналов и обеспечивать представление в частотной области каждого скомпенсированного цифрового сигнала. Для определения и обеспечения представления в частотной области может быть использован любой подходящий метод, такой как дискретное преобразование Фурье (например, быстрое преобразование Фурье), набор фильтров или вейвлет-преобразование. Представление в частотной области может включать только один или более выбранных частотных диапазонов, которые могут соответствовать одной или более частотам, обычно встречающимся в речи.

[0050] Вычислитель 316 мощности может принимать представления в частотной области и определять один или более параметров мощности для каждого микрофона 106, 108, 110. В целом, каждый параметр мощности относится к мощности сигнала микрофона в частотной области. В частности, параметры мощности могут включать только один или более выбранных частотных диапазонов, которые могут соответствовать одной или более частотам, обычно встречающимся в речи.

[0051] В целом, вычисление параметра мощности может быть выполнено в соответствии со следующим уравнением:

где А - амплитуда сигнала в выбранном частотном диапазоне f_i, N - общее число выбранных частотных диапазонов, i - индекс частотного бина, и W(A_k) - функция величины. Параметр мощности является функцией величины сигнала в выбранных частотных диапазонах.

[0052] Любая подходящая функция W может быть использована для характеризации величины сигнала. Например, параметр мощности может быть вычислен в соответствии со следующим уравнением:

где А - амплитуда сигнала в выбранном частотном диапазоне f_i, N - общее число выбранных частотных диапазонов, и i - индекс частотного бина. В этом примере величина сигнала представлена суммой квадрата амплитуды сигнала в каждом выбранном частотном диапазоне, деленной на общее количество частотных диапазонов.

[0053] Как описано в настоящем документе, один или более выбранных частотных диапазонов могут соответствовать частотным диапазонам, которые встречаются в типичной человеческой речи. В частности, один или более выбранных частотных диапазонов могут включать в себя частоты от приблизительно 100, 200 или даже 300 Гц до приблизительно 1200, 1100 или даже 1000 Гц. В одном примере один или более выбранных частотных диапазонов могут находиться в диапазоне от приблизительно 300 до 1000 Гц.

[0054] Вычислитель 318 соотношения может принимать параметры мощности, соответствующие каждому микрофону 106, 108, 110 и выдавать значение, которое сравнивает параметры мощности. В некоторых воплощениях соотношение вычисляют между двумя или более параметрами мощности. Например, параметр мощности, соответствующий одному внешнему микрофону 108, 110, может быть сравнен с параметром мощности, соответствующим голосовому микрофону 106, например, с использованием деления, с целью вычисления соотношения между ними. В другом примере параметры мощности, соответствующие внешним микрофонам 108, 110, могут быть скомбинированы (например, усреднены) и затем сравнены с параметром мощности, соответствующим голосовому микрофону 106, например, с использованием деления, с целью вычисления соотношения между ними (например, соотношения мощностей).

[0055] Компаратор 320 может принимать и сравнивать соотношение мощностей или другое сравнительное значение, полученное от вычислителя 318 соотношения, с пороговым значением. В частности, компаратор 320 может использовать пороговое соотношение (например, пороговое соотношение мощностей).

[0056] Модуль 322 принятия решения в отношении голоса может выполнять определение по меньшей мере частично на основании параметров мощности и порогового значения. В частности, модуль 322 принятия решения в отношении голоса может определять, был ли голос обнаружен или нет, на основании того, превышает ли соотношение мощностей пороговое значение соотношения мощностей. Параметр мощности голоса, соответствующий голосовому микрофону 106, может использоваться в числителе соотношения, а параметр внешней мощности, соответствующий по меньшей мере одному внешнему микрофону 108, 110, может использоваться в знаменателе соотношения. В целом, когда параметр мощности голоса, соответствующий голосовому микрофону 106, превышает параметр мощности, соответствующий одному или обоим внешним микрофонам 108, 110, на определенное значение, происходит обнаружение голоса. Другими словами, модуль 322 принятия решения в отношении голоса может определять, что голос обнаружен, когда соотношение параметров мощности (например, соотношение мощностей) превышает пороговое соотношение (например, пороговое соотношение мощностей).

[0057] Когда голос обнаружен, модуль 322 принятия решения в отношении голоса может разрешать преобразование и/или передачу аудиосигнала, основанного на сигнале от голосового микрофона 106. Если голос не обнаружен, модуль 322 принятия решения в отношении голоса может прекращать преобразование и/или передачу.

[0058] Процессор 306 может содержать модуль 324 улучшения аудиосигнала, который может принимать аудиосигнал и обеспечивать улучшенный аудиосигнал. В частности, модуль 324 улучшения аудиосигнала может улучшать сигнал голосового микрофона 106. В некоторых воплощениях модуль 324 улучшения аудиосигнала использует алгоритм шумоподавления для обеспечения улучшенного аудиосигнала. В целом, модуль 324 улучшения аудиосигнала использует голосовой сигнал и по меньшей мере один внешний сигнал. Например, модуль 324 улучшения аудиосигнала может использовать спектральное вычитание для вычитания величин внешнего сигнала из величин голосового сигнала в частотной области в одном или более выбранных частотных диапазонах. В другом примере модуль 324 улучшения аудиосигнала может использовать алгоритм минимальной среднеквадратичной ошибки (MMSE) используя голосовой сигнал и по меньшей мере один внешний сигнал в качестве входных данных. Алгоритм MMSE может обеспечиваться меньшее количество артефактов, чем спектральное вычитание.

[0059] Алгоритм MMSE может быть использован с представлениями в частотной области голосового сигнала и по меньшей мере одного внешнего сигнала, поскольку, например, предполагается, что спектральные компоненты речи и шума характеризуются гауссовским распределением и являются статистически независимыми. Расчетная амплитуда речи может быть получена с помощью следующего уравнения:

где где I₀ и I₁ обозначают модифицированную функцию Бесселя нулевого и первого порядка; где ν_k определяется как

где λ_k(k) и λ_d(k) - вариации спектральных компонент речи и шума соответственно;

где R_k - величина зашумленной спектральной компоненты (речь плюс шум); и где k - индекс спектральной компоненты.

[0060] Процессор 306 может содержать преобразователь сообщений 326, который может принимать аудиосигнал (например, улучшенный аудиосигнал) и преобразовывать подлежащий передаче аудиосигнал (например, посредством приемопередатчика 212). Может использоваться любой подходящий метод преобразования, такой как частотная модуляция (ЧМ), амплитудная модуляция (AM), преобразование ITU-T G.726, ITU-T G.727 или ITU-T G.729.

[0061] Процессор 306 может быть функционально связан с запоминающим устройством 308, которое может быть использовано для хранения данных, относящихся к реализации одного или более модулей процессора. Примеры данных, которые могут храниться в запоминающем устройстве 308, схематически показаны на фиг. 4.

[0062] На фиг. 4 запоминающее устройство 308 может быть использовано для хранения данных 350 голосового сигнал, представляющих голосовой сигнал в цифровой форме. Запоминающее устройство 308 может быть использовано для хранения данных 352 внешнего сигнала, представляющих один или более внешних сигналов в цифровой форме. Параметр 354 мощности голоса и параметр 356 внешней мощности, вычисляемые процессором 306, могут храниться в запоминающем устройстве 308. Сравнение 358 мощностей может храниться в запоминающем устройстве 308, например, в виде соотношения мощностей. Запоминающее устройство 308 может хранить пороговое значение 360, которое может быть извлечено, например, для сравнения с соотношением мощностей. Пороговое значение 360 может включать в себя одно пороговое значение или разные пороговые значения. В некоторых воплощениях пороговые значения для включения и выключения преобразования и/или передачи являются одинаковыми или равными. В других воплощениях пороговые значения для включения и выключения преобразования и/или передачи являются разными. Каждое пороговое значение 360 может быть настроено для конкретного аппаратного обеспечения используемой головной гарнитуры. Каждое пороговое значение 360 может быть определено с использованием метода проб и ошибок для конкретного аппаратного обеспечения. Аудиосигнал 362, который может быть улучшен, перед передачей может храниться в запоминающем устройстве 308.

[0063] При описании различных компонентов головной гарнитуры 102 (фиг. 1) в настоящем документе описаны различные способы, относящиеся к активируемому голосом преобразованию, которые могут использоваться с головной гарнитурой со ссылкой на фиг. 5-8.

[0064] На фиг. 5 показан один способ 400 активируемого голосом преобразования, который может быть осуществлен с использованием различных компонентов головной гарнитуры 102. Способ 400 может включать прослушивание микрофонов 402. На основании сигналов от микрофонов способ 400 может решить, обнаружен ли 404 голос. При обнаружении голоса способ 400 может обеспечивать улучшение аудио 406 перед передачей. При обнаружении голоса способ 400 может обеспечивать избирательное преобразование и/или передачу аудио на другое устройство 408. Аудио может быть улучшено или нет. Если голос не обнаружен, способ 400 может прекращать преобразование и/или передачу аудио.

[0065] На фиг. 6 показан один из примеров способа 404 принятия решения касательно того, обнаружен ли голос. Способ 404 может включать определение параметров мощности на основании представления сигналов 410 микрофона в частотной области. По меньшей мере два сигнала микрофона могут быть использованы, например, один для голосового сигнала и один для внешнего сигнала. Способ 404 может включать в себя запуск преобразования аудиосигнала на основании сравнения параметров мощности и порогового значения. Например, сравнение параметров мощности может обеспечивать значение (например, соотношение), которое затем может быть сравнено с пороговым значением (например, пороговым соотношением).

[0066] На фиг. 7 другой пример способа 404 принятия решения касательно того, обнаружен ли голос, показан более подробно, чем на фиг. 6. Способ 404 может включать прием голосового сигнала от голосового микрофона на штанге 414 и может включать прием по меньшей мере одного внешнего сигнала от одного или более внешних микрофонов 416. Внешние микрофоны могут быть расположены таким образом, чтобы принимать окружающий звук, отличающийся от голоса пользователя. Как показано, один или более внешних сигналов могут быть скомпенсированы на основании частотной характеристики 418. Применение частотной компенсации может обеспечивать более точное сравнение голосового сигнала с внешними сигналами.

[0067] Один или более микрофонов, таких как внешние микрофоны 416, могут быть уровнезависимыми. Используемый в настоящем документе термин «уровнезависимый» относится к регулировке уровня одного или нескольких микрофонов головной гарнитуры на основании уровня окружающих (например, внешних) звуков, что может помочь защитить органы слуха пользователя. Уровнезависимая функция (LDF) может быть использована для калибровки уровня внешних микрофонов 416.

[0068] Способ 404 может включать применение преобразования Фурье (например, быстрое преобразование Фурье или FFT) в отношении голосового сигнала 420, а также применение преобразования Фурье к одному или более из внешних сигналов 422 для обеспечения представлений в частотной области для голоса и внешних сигналов.

[0069] Представления в частотной области могут быть использованы в способе 404 для обеспечения параметра мощности для голосового сигнала 424 и по меньшей мере одного параметра мощности для внешнего сигнала 426. Параметры мощности могут сравниваться в способе 404 путем вычисления соотношения мощностей между по меньшей мере двумя из параметров 428 мощности (например, соотношение между параметром мощности голоса и средним значением параметров внешней мощности). В частности, параметр мощности голоса может соответствовать числителю соотношения мощностей, а параметры внешней мощности могут соответствовать знаменателю соотношения мощностей. Более высокое значение параметра мощности голоса может указывать на более громкий голос и может приводить к более высокому соотношению мощностей.

[0070] Способ 404 может включать сравнение соотношения мощностей с пороговым значением соотношения 430 мощностей, например, чтобы увидеть, превышает ли соотношение мощностей пороговое значение соотношения мощностей. Способ 404 может включать принятие решения касательно того, обнаружен ли 432 голос на основании сравнения соотношения мощностей с пороговым значением соотношения мощностей. Когда соотношение мощностей превышает пороговое значение соотношения мощностей, происходит обнаружение голоса.

[0071] На фиг. 8, показан один из примеров способа 406 улучшения аудио. Способ 406 может включать прием зашумленной речи 440. Один или более сигналов, представляющих зашумленную речь, могут быть преобразованы в представление в частотной области 442, например, с применением FFT. Представления в частотной области могут быть использованы в качестве входных данных в алгоритме 444 шумоподавления (например, алгоритм MMSE). Выходные данные алгоритма шумоподавления могут быть преобразованы в представление 446 в частотной области, например, с применением обратного FFT. Представление в частотной области может быть использовано для обеспечения улучшенного аудио или речи 448, которые могут быть преобразованы и/или переданы на другое устройство.

[0072] С помощью различных примеров и приведенных в качестве примеров воплощений активируемого голосом преобразования звука для описанных головных гарнитур в настоящем документе описаны различные примеры, чтобы дополнительно показать различные технические эффекты и преимущества, а также различные комбинации, которые могут быть использованы.

ПРИМЕРЫ

[0073] Коммуникационная головная гарнитура, содержащая внешний и голосовой микрофоны, как показано на фиг. 1, была использована в следующих примерах. Головную гарнитуру помещали на имитатор головы и торса (HATS) Brtiel & Kjr (Neerum, Дания) Type 4128C в закрытой акустической комнате с громкоговорителями. В HATS также содержался имитатор рта, который использовали для передачи голосового сигнала в микрофон на штанге. Громкоговорители использовались для внесения шумовых сигналов в окружающую среду. Предварительно записанные сигналы, представляющие голос, шум вертолета или розовый шум, использовались для имитации работы активируемого голосом преобразования для речи и речи в шумных условиях, которые могут включать в себя шум вертолета или розовый шум. Шумовые сигналы производились при уровне звукового давления 85 и 105 дБА SPL и записывались вместе с голосовым сигналом с помощью звуковой карты, подключенной к персональному компьютеру. Все сигналы были записаны с частотой дискретизации 32 кГц и разрядностью 16 бит. Оцифрованные записи были пост-обработаны на персональном компьютере с использованием программного обеспечения Adobe Audition (Сан-Хосе, Калифорния) для синхронизации времени.

[0074] В таблице 1 описаны параметры и уравнения, используемые в алгоритме VOX А предшествующего уровня техники и в примерном алгоритме VOX В настоящего раскрытия, при этом MB - величина сигнала микрофона на штанге, а МС - величина скомпенсированного сигнала микрофона в окружающей среде.

[0075] В примере 1 речевой сигнал использовался в качестве входных данных для алгоритма VOX А (например, традиционного VOX), чтобы показать один пример ожидаемой работы алгоритмов VOX до введения шума. Результаты показаны на графике 500 на фиг. 9, на котором изображено представление амплитуды речевого сигнала и решений алгоритма VOX в течение периода времени 10 секунд. Данные выборки по оси х (например, время) были нормализованы к диапазону от 0 до 10. Алгоритм VOX был ограничен двоичными значениями: 0 для отсутствия речи и 1 для обнаружения речи. Как видно на фиг. 9, алгоритм VOX сначала начал обнаруживать речевой сигнал приблизительно на 1,5 и остановился приблизительно на 4,2, и затем начал обнаруживать речь приблизительно на 7,4 и остановился примерно после 10.

[0076] В примере 2 речевой сигнал был объединен с шумовым сигналом вертолета и использован в качестве входных данных для алгоритма VOX А (например, традиционного VOX) и алгоритма VOX В (например, нового/реализованного VOX). Результаты показаны на графике 510 на фиг. 10, на котором изображено представление сигнала «речь плюс шум вертолета», а также решения, принимаемые алгоритмами VOX А и В в течение периода времени приблизительно 10 секунд. Данные выборки по оси х (например, время) были нормализованы к диапазону от 0 до 10. Алгоритмы VOX были ограничены двоичными значениями: 0 для отсутствия речи и 1 для обнаружения речи. Как видно на фиг. 10, алгоритм VOX А начал обнаруживать сигнал «речь плюс шум вертолета» сразу после значения времени 0 и закончил примерно после значения 10, указывая на неспособность алгоритма VOX А распознавать речь в комбинированном сигнале. С другой стороны, алгоритм VOX В сначала начал обнаруживать речевой сигнал в комбинированном сигнале «речь плюс шум вертолета» приблизительно на 1,9 и остановился приблизительно на 5,9, и затем начал обнаруживать речь приблизительно на 7,3 и остановился примерно после 10. Считается, что улучшение работы обусловлено использованием дополнительной информации от внешнего микрофона.

[0077] В примере 3 речевой сигнал был объединен с сигналом розового шума и использован в качестве входных данных для алгоритма VOX А (например, традиционного VOX) и алгоритма VOX В (например, нового/реализованного VOX). Результаты показаны на графике 520 на фиг. 11, на котором изображено представление сигнала «речь плюс розовый шум», а также решения, принимаемые алгоритмами VOX А и В в течение периода времени приблизительно 10 секунд. Данные выборки по оси х (например, время) были нормализованы к диапазону от 0 до 10. Алгоритмы VOX были ограничены двоичными значениями: 0 для отсутствия речи и 1 для обнаружения речи. Как видно на фиг. 11, алгоритм VOX А начал обнаруживать речь сразу после значения времени 0 и закончил примерно после значения 10, указывая на неспособность алгоритма VOX А распознавать речь в комбинированном сигнале. С другой стороны, алгоритм VOX В сначала начал обнаруживать речь в комбинированном сигнале «речь плюс розовый шум» приблизительно на 1,6 и остановился приблизительно на 4,2, и затем начал обнаруживать речь приблизительно на 6,9 и остановился примерно после 10. Считается, что улучшение работы обусловлено использованием дополнительной информации от внешнего микрофона.

ПРИВЕДЕННЫЕ В КАЧЕСТВЕ ПРИМЕРОВ ВОПЛОЩЕНИЯ

[0078] В различных приведенных в качестве примеров воплощениях устройство может содержать голосовой микрофон, выполненный с возможностью генерирования голосового сигнала на основании звука, обнаруженного вблизи голосового микрофона. Устройство может содержать по меньшей мере один внешний микрофон, пространственно разнесенный с голосовым микрофоном, и выполненный с возможностью генерирования по меньшей мере одного внешнего сигнала на основании звука, обнаруженного вблизи указанного по меньшей мере одного внешнего микрофона. Устройство может дополнительно содержать контроллер, функционально связанный с микрофонами. Контроллер может содержать преобразователь сообщений, выполненный с возможностью преобразования аудиосигнала для передачи на другое устройство. Контроллер может быть выполнен с возможностью определения параметра мощности голоса на основании представления в частотной области голосового сигнала. Контроллер также может быть выполнен с возможностью определения параметра внешней мощности на основании представления в частотной области указанного по меньшей мере одного внешнего сигнала. Контроллер может быть дополнительно выполнен с возможностью преобразования аудиосигнала на основании голосового сигнала с использованием преобразователя сообщений в ответ на определение, которое основано по меньшей мере частично на параметрах мощности и пороговом значении.

[0079] В различных приведенных в качестве примеров воплощениях контроллер может содержать интерфейс ввода, выполненный с возможностью приема голосового сигнала и по меньшей мере одного внешнего сигнала. Контроллер может также содержать интерфейс вывода, выполненный с возможностью обеспечения аудиосигнала на основании голосового сигнала. Контроллер может дополнительно содержать запоминающее устройство, выполненное с возможностью хранения представления голосового сигнала и внешнего сигнала. Кроме того, контроллер может содержать процессор, функционально связанный с интерфейсом ввода, интерфейсом вывода и запоминающим устройством. Процессор может быть выполнен с возможностью определения параметра мощности голоса на основании представления в частотной области голосового сигнала. Процессор также может быть выполнен с возможностью определения параметра внешней мощности на основании представления в частотной области указанного по меньшей мере одного внешнего сигнала. Процессор может быть дополнительно выполнен с возможностью преобразования аудиосигнала на основании голосового сигнала в ответ на определение, которое основано по меньшей мере частично на параметрах мощности и пороговом значении.

[0080] В различных приведенных в качестве примеров воплощениях способ может включать определение параметра мощности голоса на основании представления в частотной области голосового сигнала, поступающего от голосового микрофона. Способ может также включать определение параметра внешней мощности на основании представления в частотной области по меньшей мере одного внешнего сигнала, поступающего по меньшей мере от одного внешнего микрофона, пространственно разнесенного с голосовым микрофоном. Способ может дополнительно включать преобразование аудиосигнала с использованием микропроцессора на основании голосового сигнала в ответ на определение, основанное по меньшей мере частично на параметрах мощности и пороговом значении.

[0081] В одном или более приведенных в качестве примеров воплощениях преобразование может быть отключено на основании сравнения параметров мощности и порогового значения, которое может быть таким же или отличаться от указанного порогового значения для включения преобразования.

[0082] В одном или более приведенных в качестве примеров воплощениях передача может быть включена или выключена на основании того, было ли включено или выключено преобразование, соответственно.

[0083] В одном или более приведенных в качестве примеров воплощениях соотношение может быть определено между параметрами мощности. Параметры мощности могут быть сравнены с использованием соотношения между параметрами мощности.

[0084] В одном или более приведенных в качестве примеров воплощениях соотношение между параметрами мощности может быть сравнено с пороговым соотношением в качестве порогового значения.

[0085] В одном или более приведенных в качестве примеров воплощениях соответствующие представления в частотной области могут быть определены с использованием по меньшей мере одного из дискретного преобразования Фурье, набора фильтров или вейвлет-преобразования.

[0086] В одном или более приведенных в качестве примеров воплощениях соответствующие параметры мощности могут быть определены на основании величин в выбранных частотных диапазонах.

[0087] В одном или более приведенных в качестве примеров воплощениях голосовой сигнал и указанный по меньшей мере один внешний сигнал могут быть преобразованы из аналоговой в цифровую форму перед определением соответствующих параметров мощности.

[0088] В одном или более приведенных в качестве примеров воплощениях указанный по меньшей мере один внешний сигнал может быть скомпенсирован на основании отличий частотных характеристик указанного по меньшей мере одного внешнего микрофона и голосового микрофона.

[0089] В одном или более приведенных в качестве примеров воплощениях улучшенный аудиосигнал может быть обеспечен в качестве аудиосигнала на основании представления в частотной области голосового сигнала и представления в частотной области указанного по меньшей мере одного внешнего сигнала с использованием алгоритма шумоподавления.

[0090] В одном или более приведенных в качестве примеров воплощениях величина аудиосигнала может быть определена на основании голосового сигнала и указанного по меньшей мере одного внешнего сигнала с использованием алгоритма шумоподавления. Аудиосигнал может быть обеспечен на основании определенной величины.

[0091] В одном или более приведенных в качестве примеров воплощениях указанный по меньшей мере один внешний микрофон может включать в себя первый и второй внешние микрофоны, пространственно разнесенные с голосовым микрофоном.

[0092] В одно или более приведенных в качестве примеров воплощений могут быть включены первый ушной аппарат и второй ушной аппарат. Каждый ушной аппарат может содержать динамик и соответствующий один из первого и второго внешних микрофонов.

[0093] В одно или более приведенных в качестве примеров воплощений может быть включено оголовье, протяженное между первым и вторым ушными аппаратами.

[0094] В одно или более приведенных в качестве примеров воплощений может быть включена штанга, протяженная от одного из первого и второго ушных аппаратов к голосовому микрофону.

[0095] В одно или более приведенных в качестве примеров воплощений может быть включен приемопередатчик, выполненный с возможностью передачи преобразованного аудиосигнала.

[0096] Таким образом, были раскрыты различные аспекты, примеры и воплощения активируемого голосом преобразования звука для головных гарнитур с использованием представления сигналов микрофона в частотной области. Хотя в настоящем документе сделана ссылка на сопроводительный набор чертежей, которые составляют часть настоящей заявки, любой по меньшей мере рядовой специалист в данной области техники поймет, что различные адаптации и модификации воплощений, описанных в настоящем документе, находятся в пределах или не отклоняются от объема раскрытия настоящей заявки. Например, аспекты воплощений, описанных в настоящем документе, могут быть скомбинированы друг с другом множеством способов. Следовательно, следует понимать, что в рамках прилагаемой формулы изобретения заявленное изобретение может быть реализовано на практике иначе, чем явно описано в настоящем документе.

[0097] В частности, следует понимать, что каждый блок блок-схем и комбинации этих блоков могут быть реализованы посредством выполнения изображенной функции.

[0098] Все ссылки и публикации, процитированные в настоящем документе, прямо включены в настоящий документ посредством ссылки во всей своей полноте в раскрытие настоящей заявки, за исключением тех случаев, когда они могут прямо противоречить настоящему раскрытию.

[0099] Все используемые настоящем документе научные и технические термины имеют значения, обычно используемые в данной области техники, если не указано иное. Приведенные в настоящем документе определения предназначены для облегчения понимания определенных терминов, часто используемых в настоящем документе, и не предназначены для ограничения объема раскрытия настоящей заявки.

[0100] Если не указано иное, все используемые в настоящем описании и пунктах формулы числовые значения, выражающие размер элемента, количества и физические свойства, могут рассматриваться как модифицированные любым из терминов «точно» или «приблизительно». Соответственно, если не указано обратное, числовые параметры, указанные в предшествующем описании и прилагаемой формуле изобретения, являются приблизительными значениями, которые могут изменяться в зависимости от предпочтительных свойств, которые стремятся получить специалисты в данной области техники с применением описанных в настоящем документе идей или, например, в пределах типичных диапазонов экспериментальной ошибки.

[0101] Перечисление числовых диапазонов посредством их крайних значений включает все числа, находящиеся в этом диапазоне (например, 1-5 включает 1; 1,5; 2; 2,75; 3; 3,80; 4 и 5), а также любой диапазон в пределах этого диапазона. В настоящем документе термины «до» или «не более чем» число (например, до 50) включают указанное число (например, 50), и термин «не менее чем» число (например, не менее 5) включает указанное число (например, 5).

[0102] Термины «связанный» или «соединенный» относятся к элементам, прикрепляемым друг к другу либо напрямую (в непосредственном контакте друг с другом), либо опосредованно (с использованием одного или более элементов, расположенных между указанными двумя элементами и скрепляющих их). Любой термин может быть модифицирован термином «функционально» и «оперативно», которые могут использоваться взаимозаменяемо, чтобы описать, что связь или соединение сконфигурированы так, чтобы позволить компонентам взаимодействовать для выполнения по меньшей мере некоторых функций (например, контроллер, функционально связанный с трансивером, может позволить контроллеру передавать сигналы с помощью трансивера).

[0103] Термин «и/или» означает один или все перечисленные элементы или комбинацию по меньшей мере из двух перечисленных элементов (например, микрофон и/или динамик означает микрофон, динамик или и микрофон, и динамик).

1. Головная гарнитура, содержащая: голосовой микрофон, выполненный с возможностью генерирования голосового сигнала на основании звука, обнаруженного вблизи голосового микрофона, причем голосовой микрофон проходит от головной гарнитуры; внешний микрофон, пространственно разнесенный с голосовым микрофоном, причем внешний микрофон расположен на внешней стороне головной гарнитуры и выполнен с возможностью обнаружения звука снаружи головной гарнитуры, причем внешний микрофон выполнен с возможностью генерирования внешнего сигнала на основании звука, обнаруженного вблизи указанного внешнего микрофона; и контроллер, функционально связанный с микрофонами, при этом контроллер содержит преобразователь сообщений, выполненный с возможностью преобразования аудиосигнала для передачи на другое устройство, при этом контроллер выполнен с возможностью: определения параметра мощности голоса на основании представления в частотной области голосового сигнала; определения параметра внешней мощности на основании представления в частотной области указанного внешнего сигнала; и преобразования аудиосигнала на основании голосового сигнала с использованием преобразователя сообщений в ответ на определение, которое основано на указанных параметрах мощности голоса, внешней мощности и пороговом значении.

2. Головная гарнитура по п. 1, в которой контроллер дополнительно выполнен с возможностью определения соотношения между указанными параметрами мощности и сравнения указанного соотношения с пороговым соотношением в качестве порогового значения.

3. Головная гарнитура по п. 1 или 2, в которой контроллер выполнен с возможностью определения соответствующих представлений в частотной области с использованием по меньшей мере одного из дискретного преобразования Фурье, набора фильтров или вейвлет- преобразования.

4. Головная гарнитура по любому из предыдущих пунктов, в которой контроллер выполнен с возможностью определения указанных соответствующих параметров мощности на основании величин в выбранных частотных диапазонах.

5. Головная гарнитура по любому из предыдущих пунктов, в которой контроллер выполнен с возможностью преобразования голосового сигнала и указанного по меньшей мере одного внешнего сигнала из аналоговой в цифровую форму перед определением указанных соответствующих параметров мощности.

6. Головная гарнитура по любому из предыдущих пунктов, в которой контроллер выполнен с возможностью компенсации указанного по меньшей мере одного внешнего сигнала на основании отличий частотных характеристик указанного по меньшей мере одного внешнего микрофона и голосового микрофона.

7. Головная гарнитура по любому из предыдущих пунктов, в которой контроллер выполнен с возможностью обеспечения улучшенного аудиосигнала в качестве указанного аудиосигнала на основании представления в частотной области голосового сигнала и представления в частотной области указанного по меньшей мере одного внешнего сигнала с использованием алгоритма шумоподавления.

8. Головная гарнитура по любому из предыдущих пунктов, в которой указанный по меньшей мере один внешний микрофон содержит первый и второй внешние микрофоны, пространственно разнесенные с голосовым микрофоном.

9. Головная гарнитура по п. 8, дополнительно содержащая первый ушной аппарат и второй ушной аппарат, при этом каждый ушной аппарат содержит динамик и соответствующий один из указанных первого и второго внешних микрофонов.

10. Головная гарнитура по п. 9, дополнительно содержащая: оголовье, протяженное между указанными первым и вторым ушными аппаратами; и штангу, протяженную от одного из указанных первого и второго ушных аппаратов к указанному голосовому микрофону.

11. Контроллер для головной гарнитуры, содержащий: интерфейс ввода, выполненный с возможностью приема голосового сигнала и по меньшей мере одного внешнего сигнала, причем голосовой сигнал принимается от голосового микрофона, внешний сигнал принимается от внешнего микрофона, а голосовой микрофон и внешний микрофон расположены на внешней стороне головной гарнитуры; интерфейс вывода, выполненный с возможностью обеспечения аудиосигнала на основании голосового сигнала; запоминающее устройство, выполненное с возможностью хранения представления голосового сигнала и внешнего сигнала; и процессор, функционально связанный с интерфейсом ввода, интерфейсом вывода и запоминающим устройством, при этом процессор выполнен с возможностью: определения параметра мощности голоса на основании представления в частотной области голосового сигнала; определения параметра внешней мощности на основании представления в частотной области указанного по меньшей мере одного внешнего сигнала; и преобразования аудиосигнала на основании голосового сигнала в ответ на определение, которое основано по меньшей мере частично на указанных параметрах мощности и пороговом значении.

12. Контроллер по п. 11, в котором процессор дополнительно выполнен с возможностью определения соотношения между указанными параметрами мощности и сравнения указанного соотношения с пороговым соотношением в качестве порогового значения.

13. Контроллер по п. 11 или 12, в котором процессор выполнен с возможностью определения соответствующего представления в частотной области с использованием по меньшей мере одного из дискретного преобразования Фурье, набора фильтров или вейвлет-преобразования.

14. Контроллер по любому из пп. 11-13, дополнительно содержащий: преобразователь сообщений, выполненный с возможностью преобразования аудиосигнала на основании голосового сигнала; приемопередатчик, выполненный с возможностью передачи преобразованного аудиосигнала.

15. Контроллер по любому из пп. 11-14, в котором процессор выполнен с возможностью преобразования голосового сигнала и указанного по меньшей мере одного внешнего сигнала из аналоговой в цифровую форму перед определением указанных соответствующих параметров мощности.

16. Контроллер по любому из пп. 11-15, в котором процессор выполнен с возможностью компенсации указанного по меньшей мере одного внешнего сигнала на основании отличий частотных характеристик указанного по меньшей мере одного внешнего микрофона и указанного голосового микрофона.

17. Контроллер по любому из пп. 11-16, в котором процессор выполнен с возможностью обеспечения улучшенного аудиосигнала в качестве аудиосигнала на основании представления в частотной области указанного голосового сигнала и представления в частотной области указанного по меньшей мере одного внешнего сигнала с использованием алгоритма шумоподавления.

18. Способ активируемого голосом преобразования, содержащий: определение параметра мощности голоса на основании представления в частотной области голосового сигнала, поступающего от голосового микрофона, причем голосовой микрофон расположен на внешней стороне головной гарнитуры; определение параметра внешней мощности на основании представления в частотной области по меньшей мере одного внешнего сигнала, поступающего по меньшей мере от одного внешнего микрофона, пространственно разнесенного с указанным голосовым микрофоном, причем внешний микрофон расположен на внешней стороне головной гарнитуры; и преобразование аудиосигнала с использованием микропроцессора на основании указанного голосового сигнала в ответ на определение, основанное по меньшей мере частично на указанных параметрах мощности и пороговом значении.

19. Способ по п. 18, дополнительно содержащий: определение указанных соответствующих параметров мощности на основании величин в выбранных частотных диапазонах; и сравнивание указанных параметров мощности с использованием соотношения между параметрами мощности; и сравнивание указанного соотношения с пороговым соотношением в качестве порогового значения.

20. Способ по п. 18 или 19, дополнительно содержащий: определение величины аудиосигнала на основании указанного голосового сигнала и указанного по меньшей мере одного внешнего сигнала с использованием алгоритма шумоподавления; и обеспечение аудиосигнала на основании указанной определенной величины.

Изобретение относится к области радиотехники, а именно к приемникам, и может быть использовано для обнаружения микронаушников. Техническим результатом является увеличение дальности приема на максимально возможную длину распространения магнитных волн, а также избирательность обнаружения.

Передискретизация звукового сигнала для кодирования/декодирования с малой задержкой // 2756042

Изобретение относится к области вычислительной техники для обработки аудиосигналов. Технический результат заключается в повышении качества обработки сигнала звуковой частоты.

Способ синтеза речи с передачей достоверного интонирования клонируемого образца // 2754920

Изобретение относится к способам синтезирования речи с использованием искусственных нейронных сетей и может быть применено для синтеза речи выбранного спикера с передачей достоверного интонирования клонируемого образца. Технический результат изобретения состоит в том, что достигается передача достоверного интонирования клонируемого образца речи выбранного спикера на естественном языке.

Захват аудио с использованием формирования диаграммы направленности // 2751760

Изобретение относится к акустике. Устройство захвата звука содержит формирователь диаграммы направленности, который выполнен с возможностью генерировать выходной аудиосигнал со сформированной диаграммой направленности.

Компьютерное устройство коммуникации с пользователем // 2746468

Изобретение относится к компьютерным устройствам коммуникации с пользователем. Технический результат заключается в обеспечении возможности в ответ на голосовые запросы пользователя передавать ему объемную визуальную информацию из внешних источников, при этом адаптировать ее для вывода на объёмный дисплей.

Оборудование и способ определения информации основного тона // 2745717

Изобретение относится к обработке аудиосигналов и может быть использовано для получения информации основного тона из аудиосигнала. Оборудование для определения информации основного тона на основе аудиосигнала выполнено с возможностью получать значение подобия, связанное с данной парой частей аудиосигнала, имеющего данный сдвиг по времени, при этом оборудование выполнено с возможностью выбирать длину частей сигнала для аудиосигнала, используемого для того, чтобы получать значение подобия для данного сдвига по времени, в зависимости от данного сдвига по времени, и причем оборудование выполнено с возможностью выбирать длину частей сигнала таким образом, что она линейно зависит от данного сдвига по времени, в пределах допуска в ±1 дискретный отсчет.

Выбор задержки основного тона // 2742739

Изобретение относится к области вычислительной техники для кодирования и декодирования информационного сигнала. Технический результат заключается в повышении точности оценок задержки основного тона, которые лучше подходят к комплексным сигналам, с такой же или меньшей сложностью, чем в известном уровне техники.

Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи // 2742199

Изобретение относится к вычислительной технике. Технический результат заключается в уменьшении опережающего и запаздывающего эха.

Биометрический способ идентификации абонента по речевому сигналу // 2742040

Изобретение относится к области вычислительной техники и связи. Технический результат заключается в обеспечении возможности дистанционной идентификации абонента.

Система голосового управления // 2741622

Изобретение относится к средствам для голосового управления. Технический результат заключается в повышении эффективности голосового управления.

Мультисенсорный способ обнаружения беспилотных летательных аппаратов // 2757928

Изобретение относится к области обнаружения объектов в воздушном пространстве, а более конкретно к мультисенсорным способам обнаружения беспилотных летательных аппаратов (БЛА) посредством измерения акустической скорости частиц совместно с радиолокационными измерениями, и может быть использовано в системах безопасности для предотвращения несанкционированного доступа БЛА в контролируемую зону. Техническим результатом изобретения является снижение вероятности ложных срабатываний и вероятности пропуска цели. В заявленном способе принимают радиолокационные сигнатуры БЛА посредством измерений спектрограмм отраженных электромагнитных волн с эффектом Доплера и одновременно принимают акустические сигнатуры БЛА в виде спектрограмм акустических волн посредством измерений акустической скорости частиц акустических волн с эффектом Доплера. Затем сравнивают спектрограммы электромагнитных волн и акустических волн в пределах регулируемого интервала времени, начиная с заданного начального момента обзора. В случае корреляции эффекта Доплера принимаемых электромагнитных волн и акустических волн выносят решение об обнаружении беспилотного летательного аппарата, категорированном с низкой вероятностью ложных срабатываний. 1 з.п. ф-лы, 1 ил.