Способ анализа и синтеза речи и устройство для его осуществления

 

Изобретение относится к речевой информатике и может быть использовано в системах вокодерной телефонии. Цель изобретения состоит в повьшеиии качества синтеза речи. Цель достигается тем, что на невокализованных сегментах при анализе параметры спектральной огибающей определяют для нескольких псевдошумовых сигналов возбуждения и выбирают такие сигналы возбуждения и параметры спектральной огибающей, которые минимизируют среднеквадратичную ошибку синтеза речи. Анализ и синтез речи осуществляются с помощью быстрого преобразования Фурье, 2 с.п. ф-лы, ип.

СОЕЗ СОВЕТСНИХ

СОЦИАЛИСТИЧЕСНИХ

РЕСПУБЛИИ (19) (11) А1

gg 4 0 10 L 7/06

ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССР

AO ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТНРЫТИЙ (21 ) 4111366/24-10 (22) 26.06.86 (46) 30.10.,88. Бюл. У 40 (72) Ю.В. Захаров (53) 534.782(088.8) (56 ) Авторское свидетельство СССР

В 909676, кл.. 0 10 L 9/00, с приоритетом от 26.02.79.

Авторское свидетельство СССР

У 1316030у кл. 0 10 L 7/06 с приоритетом or 06.01.86. (54) СПОСОБ АНАЛИЗА И СИНТЕЗА РЕЧИ И

УСТРС1ЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ (57) Изобретение относится к речевой информатике и может быть использовано в системах вокодерной телефонии.

Цель изобретения состоит в повышении качества синтеза речи. Цель достигается тем, что на невокализованных сегментах при анализе параметры спектральной огибающей определяют для нескольких псевдошумовых сигналов возбуждения и выбирают такие сигналы возбуждения и параметры спектральной огибающей, которые минимизируют среднеквадратичную ошибку синФь теза речи. Анализ и синтез речи осу- ф ществляются с помощью быстрого преобразования Фурье. 2 с.п. ф-лы, 1 ил.

1 14344

Изобретение относится к речевой информатике, а именно к цифровым кодирующим преобразованиям, и может быть использовано в вычислительной технике и технике связи для выделе5 ния, кодйрования, передачи, декодирования и реконструкции речевых сообщений.

Цель изобретения — улучшение качества синтезируемой речи.

Поставленная цель достигается тем, что при анализе невокализованных сегментов речи по критерию максимума суммы мощностей всех параметров ее 15 спектральной огибающей определяют и кодируют лучшую псевдослучайную,последовательность сигнала возбуждения, передают параметры спектраль..ной огибающей, определенной для 20 лучшей псевдослучайной последователь-! ности, и после приема, декодирования, при синтезе формируют сигнал

; возбуждения, повторяющий эту опре; деленную путем автовыбора лучшую 25 псевдослучайную последовательность.

Поставленная цель достигается так же тем,что при определении путем . автовыбора псевдослучайные последо вательности формируют многократно, 30 . для сформированных псевдослучайных последовательностей формируют ком плексно-сопряженные спектры и выде ляют параметры спектральной огибаю-! ,щей путем нормирования результатов

1 усреднения произведений спектра ис ходного речевого сигнала и комплекс.но-сопряженных спектров псевдослучайных последовательностей на усредненный спектр сигналов возбужде- 40 ния.

На чертеже изображена структурная электрическая схема предлагаемого устройства для анализа и синтеза речи. 45

Устройство состоит иэ последовательно подсоединенных к источнику 1 речевого сигнала, анализатора 2, канала 3 связи и синтезатора 4.

Блок 2 содержит фильтр 5 нижних частот, аналого-цифровой преобразователь, 6,:тактовый генератор 7,блок

8 быстрого преобразования Фурье,сумматор по модулю два, генератор 10 псевдослучайной последовательности, блок 11 быстрого преобразования Уолша, блок 12 памяти, первый квадратор 13, первый. блок 14 деления,первый накапливающий сумматор 15, блок

87

16

6 выбора максимума, детектор 17 высоты тона, генератор 18 сигналов возбуждения, блок 19 умножения, второй квадратор 20, второй 21 и третий 22 накапливающие сумматоры, второй

23 и третий 24 блоки деления, первый

25 и второй 26 коммутаторы и кодер 27.

Синтезатор 4 содержит декодер 28, генератор 29 сигналов возбуждения, генератор 30 функций Уолша, коммутатор 31, сумматор 32 по модулю два, генератор 33 псевдослучайной последовательности, блоки 34 умножения, блоки 35 быс 1рого преобразования

Фурье, цифроаналоговый преобразователь 36 и фильтр 37 нижних частот.

В анализаторе 2 последовательно включены фильтр 5 нижних частот, аналого-цифровой преобразователь 6, управляющий вход которого соединен с выходом тактового генератора 7, блок 8 быстрого преобразования Фурье, сумматор 9 по модулю два, второй вход которого соединен с выходом генератора 10 псевдослучайной последовательности, блок 11 быстрого преобразования Уолша, блок 12 памяти, первый квадратор 13, первый блок 14 деления, первый накапливающий сумматор

15 и блок 16 выбора максимума, выход которого соединен с адресным входом блока 12 памяти. В анализаторе 2 последовательно соединены детектор

17 высоты тона, вход которого соединен с выходом аналого-цифрового преобразователя 6,. генератор 18 сигналов возбуждения, блок, 19 умножения, второй накапливающий сумматор 21, третий блок 24 деления, первый коммутатор.25 и кодер 27. Первый вход блока 19 умножения соединен с выходом блока 8 быстрого преобразования

Фурье. Второй вход первого коммутатора 25 соединен с выходом блока 23 деления, вход которого соединен с выходом блока 12 памяти. Первый вход второго .коммутатора 26 соединен с выходом детектора 17 высоты тона, вторым входом кодера 27, а также с управляющими входами первого и второго коммутаторов 25 и 26 и выходом второго коммутатора 26. Выход гене-" ратора 18 сигналов возбуждения через второй квадратор 20 и третий накапливающий сумматор 22 соединен с первым входом третьего блока 24 деления. Входом анализатора 2 являет1434487

С где Р (И) комплексно-сопряженный спектр сигнала возбуждения, т.е. псевдослучайной послсдовательности, заменяющей импульсы основного тона на невокализованных

45 сегмен гах передаваемого сигнала; весовая функция, весовые функции принимают постоянные значения в смежных

55 интервалах частот; число отсчетов исходного сигнала на анализируемом сегменте. ся вход фильтра 5 низких частот 5, а выходом — вьмод кодера 27.

Синтезатор 4 связан с выходом анализатора 2 через канал связи 3. В синтезаторе 4 последовательно включены декодер 28, генератор 29 сигналов возбуждения, коммутатор 31 управляющий вход которого соединен с первым выходом декодера 28, блок 34 1р уменьшения, второй вход которого соединен с вторым выходом декодера 28, блок 35 быстрого преобразования Фурье, цифроаналоговый преобразователь

36 и фильтр 37 нижних частот 37. вы- <5 ход которого является выходом синтезатора.

Первый вход сумматора 32 по модулю два соединен с выходом генератора

30 функций Уолша вход которого соединен с первым вьглодом декодера 28. 2р

Второй вход сумматора 32 по модулю два соединен с выходом генератора

33 псевдослучайной последовательности. Выход сумматора 32 соединен с вторым информационным входом коммутатора.

Специализированное вычислительное устройство, реализованное в элементах анализатора и их связях, при поступлении на вход анализатора невокализованных звуков речи осуществляет автоматизированный поиск оптимальной псевдослучайной последовательности, которая обеспечивает,цостижепие минимума миниморума энергии ошибки представления глухих звуков речи.

Параметры спектральной огибающей, соответствующие лучшему псевдослучайному сигналу, определяются выражением: г

Определение параметров, кодируемых в направляемых в канал связи при анализе вокализованных сегментов, соответствует известным приемам анализа речевых сигналов.

После декодирования сообщений, получейньм по каналу связи в специализированном вычислительном устройстве, реализованном в элементах синтезатора, рассчитываются отсчеты синтезируемого речевого сигнала, которые сглаживаются фильтром нижних частот и передаются получателю.

Оптимизация представления невокализованных сегментов речевых сигналов улучшает восприятие глухих звуков речи и повышает разборчивость синтезированных речевых сообщений °

Формула и з обретения

l. Способ анализа и синтеза речи, включающий сегментацию речевого сигнала, определение вокализованности каждого сегмента, формирование последовательности импульсов возбуждения периодических с периодом основного тона для вокализованных сегментов или псевдослучайных для невокализованных сегментов, формирование спектра исходного речевого сигнала и комплексно-сопряженного спектра сигнала возбуждения и усреднение их произведения„ выделение параметров спектральной огибающей исходного сигнала, передачу и прием выделенных параметров, формирование сигнала возбуждения, повторяющего сигнал возбуждения, формируемый до передачи параметров, и формирование синтезируемого речевого сигнала путем фильтрации сигнала возбуждения в соответствии с принятыми параметрами, о т л и ч а ю— шийся тем, что, с целью повышения качества синтезируемой речи, псевдослучайные последовательности импульсов возбуждения формируют мно" гократно, для сформированных псевдослучайных последовательностей формируют комплексно-сопряженные спектры и выделяют параметры спектральной огибающей путем нормирования результатов усреднений произведений спектра исходного речевого сигнала и комплексно-сопряженных спектров псевдослучайных последовательностей на усредненный спектр сигналов воз34487

5 14 буждения, причем при анализе невокализованных сегментов определяют лучшую псевдослучайную последовательность по критерию максимума суммы мощностей всех параметров спектральной огибающей, передают параметры спектральной огибающей для лучшей псевдослучайной последовательности и после приема формируют сигнал возбуждения, повторяющий лучшую псевдослучайную последовательность.

2. Устройство для анализа и синтеза речи, состоящее из последовательно включенных к источнику речевого сигнала анализатора, канала связи и синтезатора, анализатдр которого содержит генератор сигналов возбуждения, генератор тактовых импульсов, блок быстрого преобразования Фурье, блок умножения, накапливающий сумматор и последовательно соединенные входной фильтр нижних частот, аналого-цифровой преобразователь, управляющий вход которого присоединен к генератору тактовых импульсов, детектор высоты тона и кодер, выход аналого-цифрового преобразователя соединен с. блоком быстрого преобразования Фурье, выход которого через блок умножения соединен с накапливающим сумматором, а вход генератора сигналов возбуждеппя соединен с детектором высоты тока, синтезатор содержит входной декодер, генератор, сигналов возбуждения, присоединенный входом к первому выходу декодера, и последовательно соединенные блок умножения, блок быстрого преобразования Фурье, цифроаналоговый преобразователь и выходной фильтр нижних астот, о т л и ч а ющ е е с я тем, что, с целью повьш|ения качества синтеэируемой речи, в анализатор введены квадраторы, накапливающие сумматоры, блоки деления, коммутаторы, генератор псевдослучайной последовательности и последовательно соединенные сумматор по модулю два, второй вход которого соеди1

50 нен с выходом генератора псевдослучайной последовательности, блок быстрого преобразования Уолша, блок памяти, первый квадратор, первый блок деления, первый накапливающий сумматор и блок выбора максимума, соединенный выходом с вторым входом второго коммутатора и адресным входом блока памяти, выход блока памяти через второй блок деления соединен с вторым входом первого коммутатора, соединенного выходом с первым входом кодера, второй вход кодера соединен с управляющими входами первого и второго коммутаторов, выходом и первым входом второго коммутатора, выход генератора сигналов возбуждения соединен с входом второго квадратора и вторым входом блока умножения, первый вход которого соединен с первым входом сумматора по модулю два, выход второго квадратора соединен через третий накапливающий сумматор с первым входом третьего блока деления, второй вход которого соединен с выходом второго накапливающего сумматора, выход третьего блока деления соединен с первым входом первого комумутатора, в синтезатор введены коммутатор, сумматор по модулю два, генератор псевдослучайной последовательности и генератор функций Уолша, вход которого соединен с первым выходом декодера и управляющим входом коммутатора, выход генератора функций Уолша соединен с первым входом сумматора по модулю два, второй вход которого соединен с выходом генератора псевдослучайной последовательности, выход сумматора по модулю два соединен с вторым информационным входом коммутатора, первый информационный вход которого соединен с вы ходом генератора сигналов возбуждения, а выход коммутатора соединен с первым входом блока умножения, второй вход которого соединен с вторым выходом декодера.

1434487

Составитель В. Махонин

Техред Л.Сердюкова

Редактор Н. Киштулинец

Корректор Г Решетник

Заказ 5560/53 Тирам 350

ВНИИПИ Государственного комитета СССР по делам изобретений и открытий

113035, Иосква, Ж-35, Раушская наб., д. 4/5

Подписное

Производственно-полиграфическое предприятие, г. Ушгород, ул. Проектная, 4

Способ анализа и синтеза речи и устройство для его осуществления Способ анализа и синтеза речи и устройство для его осуществления Способ анализа и синтеза речи и устройство для его осуществления Способ анализа и синтеза речи и устройство для его осуществления Способ анализа и синтеза речи и устройство для его осуществления 

 

Похожие патенты:

Изобретение относится к вычислительной технике, а именно к средствам отработки речевых сигналов с использованием преобразования Уолша, и может найти применение в системах автоматического распознавания, речи

Изобретение относится к те.хнике анализа и синтеза звуковы.ч волн и позволяет новысить точность спектрального анализа

Изобретение относится к технике обработки сигналов для-речевой-информатики при регистрации и нормализации речевых сигналов

Изобретение относится к области передачи и хранения акустической информации и может быть использовано при проектировании систем цифровой радиосвязи, радио и телевидения, телефонии, систем цифровой звукозаписи и звуковоспроизведения

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ) , и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ), и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии

Изобретение относится к технике речевого анализа

Изобретение относится к цифровой обработке речи

Изобретение относится к речевым декодерам, применяемым в радиоприемниках систем радиосвязи с подвижными объектами

Изобретение относится к кодированию и декодированию речи

Изобретение относится к области радиотехники, в частности к кодированию информации для расширения формата кодируемых сигналов

Изобретение относится к машинной оценке качества передачи аудиосигналов

Изобретение относится к распознаванию речи
Наверх