Способ анализа и синтеза речи и устройство для его осуществления

 

Изобретение относится к речевой информатике и может быть использовано в вычислительной технике и технике связи для выделения и реконструкции речевых сообщений. Цель изобретения - повышение качества синтезируемой речи. Устройство для анализа и синтеза речи содержит блоки быстрого преобразования Фурье и формирователи взаимного спектра сегмента речи и генерируемого в анализаторе сигнала возбуждения. При аппроксимациях спектра В-сплайнами можно определить параметры фильтрации источника без решения обширных систем уравнений, что реализуется введением блока постоянной памяти, чтением данных из которого управляет детектор высоты тона. Упрощается восстановление сигнала по параметрам, принимаемым декодером из канала связи. 2 с.п.ф-лы, 1 ил.

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК

„„SU„„15 1138

А1 (5Dy G10L 706

O C««ИЭОВРЕтЕНия

И A ВТОРСЯОМ,Ф СВйДЕТЕЛЬСТБУ

ГОСУДАРСТВЕККЫЙ КОМИТЕТ

ПО ИЗОБРЕТЕНИЯМ И О1НРЫТИЯМ

ПРИ ГНКТ СССР (21) 4116086/24-10 (22) 09.09.86 (46) 15.08.89. Ьюл. Р 30 (72) Ю.В.Захаров (53) 534.782 (088.8) (56) Авторское свидетельство. СССР

И 1434487, кл. G 10 L 7/02, 1986. (54} СПОСОБ АНАЛИЗА И СИНТЕЗА РЕЧИ

И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ (57) Изобретение относится к речевой информатике и может быть использова- . но в вычислительной технике и технике связи для выделения и реконструкции речевых сообщений. Цель изобретеИзобретение относится к речевой информатике, а именно к цифровым кодирующим и декодирующим преобразованиям сигналов, и может быть исполь-. зовано в вычислительной технике и технике связи для синтеза речевых сообщений.

Цель изобретения — повьппение качества синтезируемой речи.

На чертеже изображена структурная схема предлагаемого устройства.

Устройство состоит из последовательно соединенных источника 1 речевого сигнала, анализатора 2, канала

3 связи и синтезатора 4. Анализатор

2 содержит последовательно соединенные фильтр 5 нижних .частот (ФНЧ), .аналого-цифровой преобразователь 6 (АЦП) с тактовым генератором 7 и первый блок 8 быстрого преобразования

Фурье (БПФ). Выход АЦП 6 соединен

2 ния — повьппение качества синтезируемой речи. Устройство для анализа и синтеза речи содержит блоки быстрого преобразования Фурье и формирователи взаимного спектра сегмента речи и генерируемого в анализаторе сигнала возбуждения. При аппроксимациях спектра В-сплайнами определить параметры фильтрации источника без рещения обширных систем уравнений, что реализуется введением блока постоянной памяти, чтением данных из которого управляет детектор высоты тона. Упрощается восстановление сигнала по параметрам, принимаемым декодером из канала связи. 2 с.п. ф-лы, 1 ил.

1 также с последовательно включенными детектором 9 высоты тона и генератором 10 сигналов возбуждения. Входы первого блока 11 умножения соединены с выходами первого и второго блоков

8 и 12 БПФ. Вход второго блока 12

БПФ соединен с выходом генератора 10 сигналов возбуждения. Последовательно включены второй блок 13 умножения, входы которого соединены с выходами первого блока 11 умножения и генератора 14 базисных функций, первый накапливающий сумматор 15, третий блок

16 умножения, второй вход которого соединен с выходом блока 17 памяти, второй накапливающий сумматор 18 и кодер 19, первый вход которого соединен с выходом детектора 9 высоты тона и адресным входом блока 17 памяти.

Выходом анализатора 2 является выход кодера 19.

3 150

Синтезатор 4 содержит последовательно включенные декодер 20, вход которого является входом синтезатора

4, генератор 21 сигналов возбуждения, блок 23 БПФ, первый блок 25 умножения, второй вход которого связан с выходом генератора 22 базисных функций через второй блок 24 умножения и накапливающий сумматор 26, блок 27 обратного быстрого преобразования

Фурье (ОБПФ), цифроаналоговый преобразователь 28 и ФНЧ 29. Второй выход декодера 20 соединен с вторым входом второго блока 24 умножения. Выходом синтезатора 4 является выход ФНЧ 29.

Осуществление способа начинается с сегментации речевого сигнала. На каждом сегменте с помощью преобразования Фурье определяют его спектр

Х(4 „) на наборе частот, лежащих в диапазоне частот речевого сигнала, и принимают решение о,вокалиэованности сегмента и высоте тона. По принятому решению формируют соответствующий сигнал возбуждения и определяют его комплексно-сопряженный спектр

P ((х „). Перемножая спектр исходного речевого сигнала и комплексно-сопряженный спектр сигнала. возбуждения, получают их взаимный спектр

8(Ы„) — Х(„) Р („) ..

1138

Н ((>. ) = 2»: С У.(аи„) .

При такой передаточной функции параметры С.„„ обеспечивают минимизацию ошибки

25 и 2 е=, 1х(и„> — х(нь, >I (>> л, Д где Х(0J„) =

=Р(и) ) H(O) -) — спектр синтезированного речевого сигнала.

Устройство для анализа и синтеза речи работает следующим образом.

4 а „=.Г 1Р(,)l У((„)У„(ы„). (>> ал

Параметры сигнала возбуждения и параметры С, m1 Ì, полученные при анализе, передают в синтезатор, где на основании принятых данных фор- мируют сигнал возбуждения, который в точности совпадает с сигналом воз10 буждения, формируемым при анализе.

Затем сигнал возбуждения фильтруют в соответствии с параметрами С щ, спектральной огибающей. Передаточная функция фильтра, используемого для

15 фильтрации сигнала возбуждения, определяется выражением

Координаты разложения спектральной огибающей исходного речевого сигнала определяют путем весового усреднения взаимного спектра

S (ы „) У,„(и.>„), ш=1,..., М, (>„ л. где — диапазон частот речевого сигнала

Ж (Lv>() — базисные функции (Всплайны).

Параметры спектральной огибающей определяют путем весового суммирования координат разложения

c„=Z ь„„ n=l,...,м, (Ч= ( где b элементы. обратной корреля- ционной матрицы (Ь,„„ =

=(а „„„j базисных функций с весом, равным спектру мощности сигнала возбуждения

Исходный речевой сигнал с выхода источника 1 речевого сигнала фильт. — руется в фильтре 5 нижних частот и поступает на вход АЦП 6, управляемого тактовым генератором 7. Цифровые

10 отсчеты с выхода АЦП 6 поступают в первый блок 8 БПФ, где вычисляется спектр исходного речевого сигнала

Х(Мк ) и на вход детектора 9 высоты тона, который измеряет параметры сигнала воэбужцения. В соответствии с измеренными параметрами генератор

10 сигналов возбуждения формирует либо периодическую (на вокалиэованном сегменте), либо . псевдослучайную (на невокализованном сегменте) цифровую последовательность импульсов.

Сигнал возбуждения поступает во второй бЛок 12 БПФ, где вычисляется его

+ комплексно-сопряженный спектр Р ((х>„).

В первом блоке 11 умножения перемножаются отсчеты спектров Х(М„) и и Р ((aJ„) и на первый вход второго 0 блока 13 умножения поступают отсчеты взаимного спектра S(c >,). Генератор

5 15011

14 базисных функций вырабатывает отсчеты (O<) которые во втором блоке 13 умножения перемножаются с взаимным спектром $(й ) . Полученные

5 произведения суммируются в первом .накапливающем сумматоре 15 и на первый вход третьего блока 16 умножения поступают координаты разложения спек тральной огибающей f В блоке 17 1р памяти хранятся величины Ь,„„, предварительно рассчитанные для всех возможных сигналов возбуждения. В третьем блоке 16 умножения вычисляется ,произведение величин („, и Ь „и с вы- 15 хода второго накапливающего сумматора 18 в кодер 19 поступают параметры

1спектральной огибающей С„, В кодер

19 с выхода детектора-9 высоты тона поступают также параметры сигнала 20 возбуждения.

В синтезаторе 4 с выхода декодера 20 на вход генератора 21 сигналов возбуждения поступают параметры сигнала 4Ьзбуждения. Генератор 21 сиг- 25 налов возбуждения выполнен идентично генератору 10 сигналов возбуждения в анализаторе 2 ° Вырабатываемая им последовательность поступает в блок .

23 БПФ, где вычисляется спектр P(cuI, ) . .30

В первом блоке 24 умножения перемножаются параметры спектральной огибающей С„, поступающие с второго выхода декодера 20, и базисные функции

У„(Шк), вырабатываемые генератором

22 базисных функций. С выхода накапливающего сумматора 2б на вход второго блока 25 умножения поступают отсчеты передаточной функции Н(М4 ).

С выхода второго блока 25 умножения отсчеты спектра синтезированного сигнала R(< ) поступают в блок 270БПФ, где вычисляются отсчеты синтезированного речевого сигнала. Эти отсчеты в ЦАП 28 преобразуются в аналоговую форму и затем фильтруются в фильтре

29 нижних частот.

Аппроксимация передаточной функции сплайнами согласуется со свойствами слуха, что улучшает восприятие синте- 5р зированной речи.

Формула изобретения

1. Способ анализа и синтеза речи, включающий при анализе сегментацию речевого сигнала, определение вокалиэованности каждого сегмента, формирование последовательности импульсов

38 6 возбуждения периодических с периодом основного тона для вокализованных сегментов или псевдослучайных для ! невокалиэованных сегментов,. определение спектра исходного речевого сигнала, комплексно-сопряженного спектра и спектра мощности сигнала возбуждения, определения координат разложения путем усреднения произведения спектра исходного речевого сигнала и комплексно-сопряженного спектра сигнала возбуждения, определение и передачу параметров спектральной огибающей исходного речевого сигнала, а при синтезе — формирование сигнала возбуждения, совпадающего с сигналом возбуждения, формируемым при анализе,. и фильтрацию сигнала возбуждения в соответствии с принятыми параметрами спектральной огибающей, отличающийся тем, что, с целью повышения качества синтезируемой речи, при определении коорди" нат разложения усреднения выполняют с весами, совпадающими с базисными функциями, при определении параметров спектральной огибающей суммируют координаты разложения с весами, равными значениям элементов обратной корреляционной матрицы базисныхфункций с весом, равным спектру мощности сигнала возбуждения, а при синтезе передаточную функцию фильтрации устанавливают равной сумме базисных функций, коэффициентами в которой являются принятые пагаметры спектральной огибающей исходного речевого-сиг нала, причем базисным функциям присваивают значения В-сплайнов.

2. Устройство для анализа и синтеза речи, содержащее последовательно включенные источник речевого сигнала, анализатор, канал связи и синтезатор, состояшчй из последовательно соединенных декодера, вход которого является входом синтезатора, и генератора сигналов возбуждения и после довательно соединенных первого блока умножения, блока обратного быстрого преобразования Фурье, цифроаналогового преобразователя и фильтра нижних частот, выход которого является выходом синтезатора, анализатор содержит блок памяти, накапливающие сумматоры, детектор высоты тона, генератор.сигналов возбуждения, кодер и последовательно соединенные фильтр нижних частот, вход которого является вхо1501138

Составитель В.Махонин

Техред N.Õoäàíè÷ Корректор Т.Малец

Редактор f0. Середа

Заказ 4876/49 Тираж 343 Подписное

ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СССР

113035, Москва, Ж-35, Раушская наб., д. 4/5

Производственно-издательский комбинат " Патент", r.Óæãîðoä, ул. Гагарина,101 дом анализатора, аналого-цифровой преобразователь, управляющий вход которого соединен с выходом тактового генератора, первый блок быстрого пре5 образования Фурье и первый блок умножения, при этом выход аналого-цифрового преобразователя соединен с входом детектора высоты тона, выход которого подключен к входам генератора сигналов возбуждения и кодера, выход которого является выходом анализатора, о т л и ч а ю щ е е с я тем, что, с целью повьппения качества синтезируемой речи, в анализатор вве- 15 дены второй и третий блоки умножения, генератор базисных функций и второй блок быстрого преобразования Фурье, вход которого соединен с выходом генератора сигналов возбуждения, выход gp второго блока быстрого преобразования

Фурье связан с вторым входом кодера через первый и второй блоки умножения, первый накапливающий сумматор, третий блок умножения и второй накапливающий сумматор, второй вход второго блока умножения соединен с выходом генератора базисных функций, второй вход третьего блока умножения соединен с выходом блока памяти, адресный вход которого соединен с выходом детектора высоты тона, а в синтезатор введены блок быстрого преобразования Фурье, накапливающий сумматор, второй блок умножения и генератор базисных функций, выход которого соединен с первым входом второго блока умножения, второй вход которого соединен с вторым выходом декодера, выход второго блока умножения через накапливающий сумматор соединен с вторым входом первого блока умножения, первый вход которого соединен с выходом блока быстрого преобразования Фурье, вход которого соединен с выходом генератора сигналов возбуждения е

Способ анализа и синтеза речи и устройство для его осуществления Способ анализа и синтеза речи и устройство для его осуществления Способ анализа и синтеза речи и устройство для его осуществления Способ анализа и синтеза речи и устройство для его осуществления 

 

Похожие патенты:

Вокодер // 1490689
Изобретение относится к анализу и синтезу речи и может быть использовано в системах вокодерной телефонии

Изобретение относится к речевой информатике и может быть использовано в системах вокодерной телефонии

Изобретение относится к вычислительной технике, а именно к средствам отработки речевых сигналов с использованием преобразования Уолша, и может найти применение в системах автоматического распознавания, речи

Изобретение относится к те.хнике анализа и синтеза звуковы.ч волн и позволяет новысить точность спектрального анализа

Изобретение относится к технике обработки сигналов для-речевой-информатики при регистрации и нормализации речевых сигналов

Изобретение относится к речевой информатике и может быть использовано в системах речевого взаимодействия человека с ЭВМ

Изобретение относится к технике обработки сигналов для речевой информатики и синтеза речевых сообщений для абонентов телефонных связей.Цель изобретения - повышение качества звучания речи, синтезируемой под контролем компьютера, обслуживающего сеть цифровых абонентских синтезаторов речи

Изобретение относится к радиотехнике и связи и может быть использовано в системах передачи и приема речевых и музыкальных сигналов
Наверх