Способ повышения разборчивости речи

Авторы патента:

G10L21/0364 - Обработка сигналов речи для получения иного слышимого или неслышимого сигнала, например визуального, осязаемого, для того, чтобы модифицировать их качество или их разборчивость (G10L 19/00 имеет преимущество)

G10L21/02 - усиление речи, например подавление шума, нейтрализация эхо-сигнала (подавление эхо-сигнала в громкоговорящих телефонных системах H04M 9/08, в аппаратах для людей с дефектами слуха H04R 15/00)

Владельцы патента RU 2676022:

Общество с ограниченной ответственностью "Речевая аппаратура "Унитон" (RU)

Изобретение относится к средствам для разборчивости речи. Технический результат заключается в повышение разборчивости речи. Речевой сигнал усиливается, фильтруется системой полосовых фильтров, подается на телефон или динамик. При этом обеспечивается возможность отключения полосовых фильтров в различных комбинациях. Полосовые фильтры настроены в соответствии со спектральными зонами, несущими основные фонетические признаки звуков речи. 1 з.п. ф-лы.

Изобретение относится к области речевых технологий и может быть использовано при передаче речевого сигнала по каналам связи и оптимизации его восприятия при аудировании.

Технический результат - повышение разборчивости речи в разнообразных окружающих условиях.

Из уровня техники известны:

- Эквалайзеры, позволяющие вручную или автоматически регулировать спектральный состав воспроизводимого речевого звука.

- Способы подавление шумовых помех за счет моделирования шума из набора типовых вариантов, однако, трудно построить адекватную на каждый случай комбинацию.

- Оценка реального шума (помехи) в исходном сигнале и, затем, вычитание его из речевого сигнала с шумами. Обычно оценивают шум из предыдущих интервалов исходного сигнала, однако при динамичном изменении шума во времени оценка будет не точной.

- Традиционная система подавления эхо-сигналов, используемая в конференц-связи.

Большинство известных способов повышения разборчивости речи строятся на принципах анализа фонового шума, присутствующего в окружающем пространстве и уменьшения взаимных помех между фоном и речевым сигналом.

Принципиальной особенностью подхода в предлагаемом способе является его независимость от фоновых условий, так как повышение разборчивости речевого сигнала в данном случае производится за счет усиления устойчивых спектрально-фонетических признаков исходного речевого сигнала.

Это достигается посредством воздействия на речевой сигнал системой специально настроенных полосовых фильтров, которые усиливают в исходном сигнале фонетически значимые спектральные области и, тем самым, помогают при аудировании членить речь и распознавать ее сегменты. При этом снижается маскирующее воздействие фонового шума и облегчается опознавание речи при эффектах «недослышания».

Универсальный характер специальной настройки полосовых фильтров обусловлен анатомически заданными резонансными полостями речевого тракта, который выступает в качестве динамично меняющегося фильтрующего устройства. Для определенных совокупностей речевых звуков перемещение резонансных областей (формант) в процессе артикуляции происходит в определенных полосах частот. Набор таких полос определяется статистически, вариативные нюансы при этом размываются именно за счет статистического характера частотных полос, в результате полосы становятся более устойчивыми. Прохождение речевого сигнала в процессе коррекции через подъемы амплитудно-частотных характеристик системы фильтров, перекрывающих зоны унифицированных частотных полос, и создает эффект подчеркнутой артикулированности, отчетливости речевых сегментов. При прослушивании речи различными аудиторами в различных условиях оптимальными могут быть различные комбинации включенных полосовых фильтров.

Практическая реализация предлагаемого способа может быть решена как схематически на базе серийно выпускаемых микросхем, так и на программном уровне с использованием компьютера.

Макет устройства для испытаний эффективности предлагаемого способа был создан на базе операционных усилителей по известным схемным структурам полосовых фильтров. В макет входило четыре полосовых фильтра, настроенных:

1. на интонационно-ритмические компоненты и «носовую» форманту речи;

2. на основные форманты гласных (первую и второю);

3. на третьи форманты гласных и сонорных звуков;

4. на тембральные компоненты шипящих-свистящих звуков.

Устройство работает следующим образом. Речевой сигнал, поступающий с выхода микрофона, усиливается, фильтруется системой полосовых фильтров, любой из которых может быть отключен или включен, суммируется с исходным речевым сигналом и подается на головные телефоны для прослушивания.

При испытании макетного устройства, реализующего рассмотренный способ, использовались речевые записи различного качества, в том числе зашумленные.

Прослушивание проводилось группой экспертов-аудиторов. В качестве критерия служило более отчетливое восприятие обработанного речевого сигнала в сравнении с исходным.

Испытания макета показали однозначно положительный результат, при этом различные аудиторы в зависимости от условий и характера речевого материала задавали различные комбинации включения полосовых фильтров.

1. Способ повышения разборчивости речи, заключающийся в том, что речевой сигнал усиливается, фильтруется системой полосовых фильтров, подается на телефон или динамик, отличающийся возможностью отключения полосовых фильтров в различных комбинациях и тем, что полосовые фильтры настроены в соответствии со спектральными зонами, несущими основные фонетические признаки звуков речи.

2. Способ по п. 1, отличающийся тем, что речевой сигнал, отфильтрованный системой полосовых фильтров, суммируется с исходным речевым сигналом.

Изобретение относится к средствам для кодирования и декодирования речи. Технический результат заключается в уменьшении опережающего и запаздывающего эха.

Устройство обработки сигналов для усиления речевого компонента в многоканальном звуковом сигнале // 2673390

Изобретение относится к средствам для обработки сигналов для усиления речевого компонента в многоканальном звуковом сигнале. Технический результат заключается в повышении эффективности усиления речевого компонента в многоканальном звуковом сигнале.

Оценка коэффициентов сведения для того, чтобы формировать сигнал возбуждения в полосе высоких частот // 2672179

Изобретение относится к области обработки сигналов. Технический результат заключается в повышении эффективности обработки сигналов.

Кодер и декодер аудиосигнала, использующие процессор частотной области с заполнением промежутка в полной полосе и процессор временной области // 2671997

Изобретение относится к кодированию и декодированию аудиосигнала. Технический результат – повышение качества аудиосигнала.

Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями // 2671619

Изобретение относится к системам кодирования источников звукового сигнала. Технический результат – воспроизведение звукового сигнала с высокой точностью при условии снижения вычислительных затрат.

Кодер и декодер аудиосигнала, использующие процессор частотной области, процессор временной области и кросспроцессор для непрерывной инициализации // 2668397

Изобретение относится к кодированию и декодированию аудиосигнала. Технический результат – обеспечение усовершенствованого принципа аудиокодирования.

Способ и устройство вывода аудиосигнала, способ и устройство кодирования, способ и устройство декодирования и программа // 2668113

Изобретение относится к средствам для кодирования, декодирования и вывода аудиосигнала. Технический результат заключается в повышении качества аудиосигнала.

Оптимизированный масштабный коэффициент для расширения диапазона частот в декодере сигналов звуковой частоты // 2668058

Изобретение относится к средствам для расширения диапазона частот при декодировании аудиосигналов. Технический результат заключается в повышении эффективности расширения диапазона частот без дополнительной информации из кодера.

Способы и системы переключения технологий кодирования в устройстве // 2667973

Изобретение относится к средствам для переключения технологии кодирования при кодировании аудиосигнала. Технический результат заключается в сокращении артефактов на границах кадров и несогласованностей энергии при переключении технологии кодирования.

Генерация сигнала верхней полосы // 2667460

Изобретение относится к средствам для генерации сигнала верхней полосы. Технический результат заключается в повышении эффективности кодирования.

Декодер и способ для декодирования аудиосигнала, кодер и способ для кодирования аудиосигнала // 2675151

Изобретение относится к обработке аудиосигналов и предназначено для кодирования и декодирования аудиосигналов. Технический результат – повышение качества звука.

Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями // 2671619

Способ и устройство для обнаружения голосовой активности // 2670785

Изобретение относится к области обнаружения речевой активности (VAD). Техническим результатом является уменьшение риска отсечения середины и окончания речевых пакетов путем добавления хвостов сигнала.

Гармоническое преобразование, усовершенствованное перекрестным произведением // 2667629

Данное изобретение относится к системам звукового кодирования, которые используют способ гармонического преобразования для высокочастотной реконструкции. Технический результат заключается в повышении качества декодируемого звукового сигнала.

Способ оценки шума в аудиосигнале, средство оценки шума, аудиокодер, аудиодекодер и система для передачи аудиосигналов // 2666474

Изобретение относится к области обработки аудиосигналов. Технический результат – обеспечение эффективной оценки шума в аудиосигнале.

Усовершенствованное гармоническое преобразование на основе блока поддиапазонов // 2665298

Изобретение относится к системам кодирования исходного звукового сигнала, которые используют способ гармонического преобразования для высокочастотной реконструкции (HFR).

Кодер и декодер звукового сигнала, способ генерирования управляющих данных из звукового сигнала и способ декодирования битового потока // 2659487

Изобретение относится к средствам для кодирования и декодирования звукового сигнала и генерирования управляющих данных из звукового сигнала. Технический результат заключается в повышении качества звука.

Способ обработки речевого/звукового сигнала и устройство // 2651184

Изобретение относится к технике связи. Технический результат – улучшение акустического качества сигнала, полученного после восстановления шумовой составляющей.

Устройство и способ для многоканального прямого-окружающего разложения для обработки звукового сигнала // 2650026

Изобретение относится к средствам для обработки звукового сигнала. Технический результат заключается в повышении эффективности многоканального прямого-окружающего разложения звукового сигнала.

Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора // 2676242

Изобретение относится к средствам для кодирования аудиосигнала. Технический результат заключается в повышении эффективности кодирования аудиоданных. Извлекают свойство из базового сигнала. Извлекают дополнительную информацию для выбора, ассоциированную с базовым сигналом. Формируют параметрическое представление для оценки спектрального диапазона аудиосигнала с улучшенной частотной характеристикой, не определяемого базовым сигналом. Причем обеспечивают некоторое количество альтернативных параметрических представлений в ответ на упомянутое свойство, и при этом выбирают одно из альтернативных параметрических представлений в качестве параметрического представления в ответ на дополнительную информацию для выбора. Оценивают аудиосигнал с улучшенной частотной характеристикой с использованием выбранного параметрического представления. При формировании параметрического представления принимают параметрическую информацию улучшения частотной характеристики, ассоциированной с базовым сигналом. 6 н. и 11 з.п. ф-лы, 16 ил.