Способ повышения разборчивости речи

Изобретение относится к средствам для разборчивости речи. Технический результат заключается в повышение разборчивости речи. Речевой сигнал усиливается, фильтруется системой полосовых фильтров, подается на телефон или динамик. При этом обеспечивается возможность отключения полосовых фильтров в различных комбинациях. Полосовые фильтры настроены в соответствии со спектральными зонами, несущими основные фонетические признаки звуков речи. 1 з.п. ф-лы.

 

Изобретение относится к области речевых технологий и может быть использовано при передаче речевого сигнала по каналам связи и оптимизации его восприятия при аудировании.

Технический результат - повышение разборчивости речи в разнообразных окружающих условиях.

Из уровня техники известны:

- Эквалайзеры, позволяющие вручную или автоматически регулировать спектральный состав воспроизводимого речевого звука.

- Способы подавление шумовых помех за счет моделирования шума из набора типовых вариантов, однако, трудно построить адекватную на каждый случай комбинацию.

- Оценка реального шума (помехи) в исходном сигнале и, затем, вычитание его из речевого сигнала с шумами. Обычно оценивают шум из предыдущих интервалов исходного сигнала, однако при динамичном изменении шума во времени оценка будет не точной.

- Традиционная система подавления эхо-сигналов, используемая в конференц-связи.

Большинство известных способов повышения разборчивости речи строятся на принципах анализа фонового шума, присутствующего в окружающем пространстве и уменьшения взаимных помех между фоном и речевым сигналом.

Принципиальной особенностью подхода в предлагаемом способе является его независимость от фоновых условий, так как повышение разборчивости речевого сигнала в данном случае производится за счет усиления устойчивых спектрально-фонетических признаков исходного речевого сигнала.

Это достигается посредством воздействия на речевой сигнал системой специально настроенных полосовых фильтров, которые усиливают в исходном сигнале фонетически значимые спектральные области и, тем самым, помогают при аудировании членить речь и распознавать ее сегменты. При этом снижается маскирующее воздействие фонового шума и облегчается опознавание речи при эффектах «недослышания».

Универсальный характер специальной настройки полосовых фильтров обусловлен анатомически заданными резонансными полостями речевого тракта, который выступает в качестве динамично меняющегося фильтрующего устройства. Для определенных совокупностей речевых звуков перемещение резонансных областей (формант) в процессе артикуляции происходит в определенных полосах частот. Набор таких полос определяется статистически, вариативные нюансы при этом размываются именно за счет статистического характера частотных полос, в результате полосы становятся более устойчивыми. Прохождение речевого сигнала в процессе коррекции через подъемы амплитудно-частотных характеристик системы фильтров, перекрывающих зоны унифицированных частотных полос, и создает эффект подчеркнутой артикулированности, отчетливости речевых сегментов. При прослушивании речи различными аудиторами в различных условиях оптимальными могут быть различные комбинации включенных полосовых фильтров.

Практическая реализация предлагаемого способа может быть решена как схематически на базе серийно выпускаемых микросхем, так и на программном уровне с использованием компьютера.

Макет устройства для испытаний эффективности предлагаемого способа был создан на базе операционных усилителей по известным схемным структурам полосовых фильтров. В макет входило четыре полосовых фильтра, настроенных:

1. на интонационно-ритмические компоненты и «носовую» форманту речи;

2. на основные форманты гласных (первую и второю);

3. на третьи форманты гласных и сонорных звуков;

4. на тембральные компоненты шипящих-свистящих звуков.

Устройство работает следующим образом. Речевой сигнал, поступающий с выхода микрофона, усиливается, фильтруется системой полосовых фильтров, любой из которых может быть отключен или включен, суммируется с исходным речевым сигналом и подается на головные телефоны для прослушивания.

При испытании макетного устройства, реализующего рассмотренный способ, использовались речевые записи различного качества, в том числе зашумленные.

Прослушивание проводилось группой экспертов-аудиторов. В качестве критерия служило более отчетливое восприятие обработанного речевого сигнала в сравнении с исходным.

Испытания макета показали однозначно положительный результат, при этом различные аудиторы в зависимости от условий и характера речевого материала задавали различные комбинации включения полосовых фильтров.

1. Способ повышения разборчивости речи, заключающийся в том, что речевой сигнал усиливается, фильтруется системой полосовых фильтров, подается на телефон или динамик, отличающийся возможностью отключения полосовых фильтров в различных комбинациях и тем, что полосовые фильтры настроены в соответствии со спектральными зонами, несущими основные фонетические признаки звуков речи.

2. Способ по п. 1, отличающийся тем, что речевой сигнал, отфильтрованный системой полосовых фильтров, суммируется с исходным речевым сигналом.



 

Похожие патенты:

Изобретение относится к средствам для кодирования и декодирования речи. Технический результат заключается в уменьшении опережающего и запаздывающего эха.

Изобретение относится к средствам для обработки сигналов для усиления речевого компонента в многоканальном звуковом сигнале. Технический результат заключается в повышении эффективности усиления речевого компонента в многоканальном звуковом сигнале.

Изобретение относится к области обработки сигналов. Технический результат заключается в повышении эффективности обработки сигналов.

Изобретение относится к кодированию и декодированию аудиосигнала. Технический результат – повышение качества аудиосигнала.

Изобретение относится к системам кодирования источников звукового сигнала. Технический результат – воспроизведение звукового сигнала с высокой точностью при условии снижения вычислительных затрат.

Изобретение относится к кодированию и декодированию аудиосигнала. Технический результат – обеспечение усовершенствованого принципа аудиокодирования.

Изобретение относится к средствам для кодирования, декодирования и вывода аудиосигнала. Технический результат заключается в повышении качества аудиосигнала.

Изобретение относится к средствам для расширения диапазона частот при декодировании аудиосигналов. Технический результат заключается в повышении эффективности расширения диапазона частот без дополнительной информации из кодера.

Изобретение относится к средствам для переключения технологии кодирования при кодировании аудиосигнала. Технический результат заключается в сокращении артефактов на границах кадров и несогласованностей энергии при переключении технологии кодирования.

Изобретение относится к средствам для генерации сигнала верхней полосы. Технический результат заключается в повышении эффективности кодирования.

Изобретение относится к обработке аудиосигналов и предназначено для кодирования и декодирования аудиосигналов. Технический результат – повышение качества звука.

Изобретение относится к системам кодирования источников звукового сигнала. Технический результат – воспроизведение звукового сигнала с высокой точностью при условии снижения вычислительных затрат.

Изобретение относится к области обнаружения речевой активности (VAD). Техническим результатом является уменьшение риска отсечения середины и окончания речевых пакетов путем добавления хвостов сигнала.

Изобретение относится к кодированию и декодированию аудиосигнала. Технический результат – обеспечение усовершенствованого принципа аудиокодирования.

Данное изобретение относится к системам звукового кодирования, которые используют способ гармонического преобразования для высокочастотной реконструкции. Технический результат заключается в повышении качества декодируемого звукового сигнала.

Изобретение относится к области обработки аудиосигналов. Технический результат – обеспечение эффективной оценки шума в аудиосигнале.

Изобретение относится к системам кодирования исходного звукового сигнала, которые используют способ гармонического преобразования для высокочастотной реконструкции (HFR).

Изобретение относится к средствам для кодирования и декодирования звукового сигнала и генерирования управляющих данных из звукового сигнала. Технический результат заключается в повышении качества звука.

Изобретение относится к технике связи. Технический результат – улучшение акустического качества сигнала, полученного после восстановления шумовой составляющей.
Изобретение относится к средствам для обработки звукового сигнала. Технический результат заключается в повышении эффективности многоканального прямого-окружающего разложения звукового сигнала.

Изобретение относится к средствам для кодирования аудиосигнала. Технический результат заключается в повышении эффективности кодирования аудиоданных. Извлекают свойство из базового сигнала. Извлекают дополнительную информацию для выбора, ассоциированную с базовым сигналом. Формируют параметрическое представление для оценки спектрального диапазона аудиосигнала с улучшенной частотной характеристикой, не определяемого базовым сигналом. Причем обеспечивают некоторое количество альтернативных параметрических представлений в ответ на упомянутое свойство, и при этом выбирают одно из альтернативных параметрических представлений в качестве параметрического представления в ответ на дополнительную информацию для выбора. Оценивают аудиосигнал с улучшенной частотной характеристикой с использованием выбранного параметрического представления. При формировании параметрического представления принимают параметрическую информацию улучшения частотной характеристики, ассоциированной с базовым сигналом. 6 н. и 11 з.п. ф-лы, 16 ил.
Наверх